Visualizzazione dei risultati da 1 a 4 su 4
  1. #1

    Applicazione per scaricare tutti gli oggetti referenziati da una pagina html

    Vorrei scrivere una "semplice" applicazione per sistemi GNU/Linux o MacOS, testuale, che effettui il download di tutti gli oggetti referenziati da una pagina web, o soltanto di quelli con una certa estensione.

    Esempio:
    Ho una pagina html con una lista di url che referenzino ognuno un file pdf, voglio scaricare ognuno di questi in un solo passo inserendo come input soltanto l'url della pagina e l'estensione "pdf".

    Che approccio mi consigliate?
    PS ho considerato l'idea di sfruttare wget
    PS2 "padroneggio" soltanto c, c++ e java.

    Grazie a tutti per l'eventuale aiuto.
    /*NO COMMENT*/

  2. #2

    Moderazione

    Sposto in Kickstarter.
    Amaro C++, il gusto pieno dell'undefined behavior.

  3. #3
    Io lavorerei in Python con la libreria BeautifulSoup, puoi iterare in un momento su tutti gli elementi della pagina che hanno un attributo href o src e scaricare/filtrare quel che ti pare. Esistono comunque librerie analoghe anche per altri linguaggi (ad esempio TagSoup in Java).
    Amaro C++, il gusto pieno dell'undefined behavior.

  4. #4
    D'accordo grazie! Dato che di Python so poco e niente darò uno sguardo a TagSoup.
    /*NO COMMENT*/

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.