Visualizzazione dei risultati da 1 a 2 su 2
  1. #1
    Utente di HTML.it L'avatar di Gipple
    Registrato dal
    Mar 2009
    Messaggi
    41

    [Java] Programma che "legge" dei link da un sito web?

    Buongiorno a tutti.
    Sto cercando di creare un programmino in Java per "mio uso e consumo" (quantomeno, in linea teorica) che, sostanzialmente, mi va a leggere una pagina web (specifica) alla ricerca di alcuni link e me li stampa a schermo (l'idea è che, successivamente, utilizzando quei link, mi acceda alla pagina linkata dal link stesso e cerchi dei file immagine ... ma quello è un discorso che farò poi, meglio andare per gradi ;P).
    Io per il momento ho fatto un programma che legge la pagina in questione e la mette in un buffer, poi seguendo un post dell'archivio di HTML.it (questo) sono andato alla ricerca di ciò che mi interessava utilizzando Pattern e Matcher, che ammetto di non conoscere minimamente, e la cosa parzialmente funziona ... poichè finchè "estraggo" solo il nome del link, non ci sono problemi, ma se tento di estrarre anche il link stesso il programma mi lancia solo una marea di eccezioni.
    Spiego meglio quello che vorrei fare, nella pagina originale i Link sono abbastanza "canonici" (in versione generalizzata sono circa così):
    Io vorrei estrarre dalla pagina tutti l link alla pagina e i relativi nomi (entrambi poi saranno immagazzinati in un file), è possibile con Pattern e Matcher estrarre entrambi contemporaneamente? Altri metodi per fare ciò?
    Grazie in anticipo, ciao!

  2. #2
    Utente di HTML.it L'avatar di Gipple
    Registrato dal
    Mar 2009
    Messaggi
    41
    Non posso più editare il messaggio precedente ... ma sono riuscito nel mio intento
    Avevo commesso un errore decisamente stupido per cui sostanzialmente il controllo del Pattern non veniva fatto e chiaramente lanciava un eccezione poichè il match non poteva esistere
    Adesso che questo passaggio è stato fatto, sto cercando di sistemare alcuni piccoli problemi ... tipo mi servirebbe aiuto per trovare/realizzare una funzione che prenda i caratteri speciali in Html e li rimetta "normali" diciamo ...
    Mi spiego meglio, uno dei nomi dei link, ad esempio, è circondato da " mentre io voglio immagazzinare il nome con "
    Qualcuno può aiutarmi?

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.