Visualizzazione dei risultati da 1 a 4 su 4
  1. #1
    Utente di HTML.it L'avatar di bako
    Registrato dal
    Feb 2004
    Messaggi
    1,797

    Bash ricavare indirizzi html

    salve gente.
    ho fatto, sto facendo, uno script che trova tutti i link di una pagina html e se questi sono .pdf li scarica. ora, ho fatto:
    codice:
    link=$(lynx -dump link.html)
    for f in $link
    do
    if MANCA LA CONDIZIONE then 
      SCARICO IL LINK
    fi
    done
    come si fa la condizione? è la stringa che inzia con http:// e finisce con .pdf, ma nn iresco a farla.
    aiuti?

  2. #2
    Utente di HTML.it L'avatar di MatCap83
    Registrato dal
    Jun 2005
    residenza
    Firenze
    Messaggi
    1,319
    Il fatto che inizia con http non penso influisca... si tratta semplicemente di gestire la stringa, te devi andare a vedere gli ultimi caratteri se sono "pdf", in questo caso allora scarichi il file... ora non ricordo le funzioni delle stringhe sinceramente ! Dai un'occhiata quì:

    http://www.pluto.it/files/ildp/guide...ipulation.html

    estrapoli la parte finale, gli ultimi 3 caratteri e vedi se sono "pdf" all'interno della condizione dell'if..
    "Nessuno mi ha visto farlo, e non puoi provarlo in nessun modo!" (Bart Simpson)

    >>> www.ombresulweb.com <<<

  3. #3
    Il problema e` che devi parsare il codice HTML alla ricerca dei link che siano collegati a documenti PDF. Giustamente questa stringa puo` essere tipo http://[...].pdf, ma puo` anche trattarsi di un indirizzo relativo tipo: ../dir/documento.pdf; in questo secondo caso devi ricostruire la parte mancante della URL.

    Soluzione? Usa wget (man wget)

    codice:
    wget -nd -rl1 -T60 -U Firefox -A ".pdf" -P $DIR "$URL"
    wget si occupa di scaricare tutti i documenti .pdf della pagina, li salva in $DIR (una directory), mentre $URL e` la url della pagina.

    Ciao.
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

  4. #4
    Utente di HTML.it L'avatar di MatCap83
    Registrato dal
    Jun 2005
    residenza
    Firenze
    Messaggi
    1,319
    Originariamente inviato da Mutato
    codice:
    wget -nd -rl1 -T60 -U Firefox -A ".pdf" -P $DIR "$URL"
    Ottima soluzione .. se avrò bisogno di chiedere qualcosa di bash allora chiederò a te Mutato ...
    "Nessuno mi ha visto farlo, e non puoi provarlo in nessun modo!" (Bart Simpson)

    >>> www.ombresulweb.com <<<

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.