Spiego meglio....

questo è un esempio di come può essere fatto l'input



TC12345 is no longer current. It split into: </P>TC392055TC219343


Minimum current TC number is 302922. Maximum valid TC number is 407214
.</P></body></html>


a me interessa prendere "TC392055" e "TC219343"... ma per esvitare doppioni o falsi risultati con altre sigle che possono esser presenti (ma non cliccabili) in altri punti della pagina, vorrei prendere solo quelli cliccabili....

così

Pattern p = Pattern.compile(">[ ]*TC[0-9]+[ ]*</A>");
Matcher m = p.matcher(input);

while(m.find())
{
String tc = m.group();
System.out.println(tc);
}

individua in effetti solo quelli... ma il risultato è

>TC392055</A>
>TC219343</A>

io vorrei

TC392055
TC219343

in php mi pare si possa fare, in java come si fa a parte eventualmente lavorandoseli dopo?


Grazie