Grazie.
Ho realizzato questo!
codice:
import java.util.*;
import java.io.*;
public class estraiLink {
public static void main(String[] args) throws IOException{
File file = new File("index.htm");
Scanner input = new Scanner(file);
while (input.hasNextLine()) {
String prova = input.nextLine();
int start = 0, end = 0;
String iniziale = "<A HREF=\"";
String finale = "\"";
start = prova.indexOf(iniziale);
if (start != -1) { //se trova un link
start = start+iniziale.length();
end = prova.indexOf(finale, start);
System.out.println(prova.substring(start, end));
}
}
}
}
L'unico problema che mi rimane è che nelle pagine posso trovare scritto "A HREF" oppure "a href" per cui il mio metodo non li rileva entrambi....è facile metterci un "IgnoreCase"?