Visualizzazione dei risultati da 1 a 3 su 3
  1. #1
    Utente di HTML.it
    Registrato dal
    Mar 2007
    Messaggi
    4

    [Java] Download pagina web

    Salve,

    esiste una qualche libreria java per il download di una pagina web da un generico URL che scarichi anche le eventuali risorse della pagina stessa come ad esempio CSS, immagini, ecc. e quindi la renda visualizzabile localmente con un browser (come ad esempio permette il comando WGET sotto Linux)?

    Grazie,
    biblio

  2. #2
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284

    Re: [Java] Download pagina web

    Originariamente inviato da biblio
    esiste una qualche libreria java per il download di una pagina web da un generico URL che scarichi anche le eventuali risorse della pagina stessa come ad esempio CSS, immagini, ecc. e quindi la renda visualizzabile localmente con un browser (come ad esempio permette il comando WGET sotto Linux)?
    Se ci fosse, personalmente non la conosco. Parlando dal punto di vista tecnico, scaricare una qualunque singola risorsa dal web è triviale, basta fare un metodo come questo:

    codice:
    public static void downloadFromUrl (URL url, String localFilename, String userAgent)
        throws IOException
    {
        InputStream is = null;
        FileOutputStream fos = null;
    
        try
        {
            URLConnection urlConn = url.openConnection ();
            urlConn.setRequestProperty ("User-Agent", userAgent);
    
            is = urlConn.getInputStream ();
            fos = new FileOutputStream (localFilename);
    
            byte[] buffer = new byte[1024];
            int len;
    
            while ((len = is.read (buffer)) > 0)
                fos.write (buffer, 0, len);
        }
        finally
        {
            try {
                if (is != null)
                    is.close ();
            } finally {
                if (fos != null)
                    fos.close ();
            }
        }
    }
    Scaricare una intera pagina web comprese tutte le risorse linkate, è decisamente meno facile perché si deve analizzare il documento html e cercare tutti i tag che fanno riferimento alle risorse esterne.
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  3. #3
    Utente di HTML.it
    Registrato dal
    Mar 2007
    Messaggi
    4
    Ciao Andrea,

    grazie per la risposta.

    Sì, quello che mi hai indicato già lo conosco. Magari conviene usare htmlunit per fare una cosa da zero che ti permetta di estrarre i link interni per i vari tag ecc. e scaricarli a loro volta

    Cmq ho scoperto che esistono già applicazioni java per questo tipo di problema cercando semplicemente su google : java crawler

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.