Buongiorno a tutti.
Sto cercando di creare un programmino in Java per "mio uso e consumo" (quantomeno, in linea teorica) che, sostanzialmente, mi va a leggere una pagina web (specifica) alla ricerca di alcuni link e me li stampa a schermo (l'idea è che, successivamente, utilizzando quei link, mi acceda alla pagina linkata dal link stesso e cerchi dei file immagine ... ma quello è un discorso che farò poi, meglio andare per gradi ;P).
Io per il momento ho fatto un programma che legge la pagina in questione e la mette in un buffer, poi seguendo un post dell'archivio di HTML.it (questo) sono andato alla ricerca di ciò che mi interessava utilizzando Pattern e Matcher, che ammetto di non conoscere minimamente, e la cosa parzialmente funziona ... poichè finchè "estraggo" solo il nome del link, non ci sono problemi, ma se tento di estrarre anche il link stesso il programma mi lancia solo una marea di eccezioni.
Spiego meglio quello che vorrei fare, nella pagina originale i Link sono abbastanza "canonici" (in versione generalizzata sono circa così):
Io vorrei estrarre dalla pagina tutti l link alla pagina e i relativi nomi (entrambi poi saranno immagazzinati in un file), è possibile con Pattern e Matcher estrarre entrambi contemporaneamente? Altri metodi per fare ciò?
Grazie in anticipo, ciao!