Facciamo così ti faccio vedere da che cosa devo estrapolare cosa
(e cmq no, non ho mai usato le regexp, se non in php, e so benissimo cosa siano)
codice:
http://listaeagles.altervista.org/index.php?m=1&q=Operazione.Valchiria
Vedi che c'è un elenco di risultati che inizia con un #, seguito da una o due cifre indicanti il numero del file, seguita da una stringa seguita da uno spazio, seguita da un'altra stringa indicante la dimensione del file (una-tre cifre seguita da M o K o G), seguita da uno spazio, infine il nome del file
Dopo l'ultimo risultato c'è dell'altro testo, quindi non necessariamente un altro cancelletto.
Suggerimenti?
Su quest'altra pagina,
codice:
get("http://www.oceanirc.net/lista/?m=1&q=$ricerca $ricerca2 $ricerca3");
in perl viene eseguito con eccellente risultato il parsing usando:
codice:
while($cont =~ m/#(.*) (.*) (.*) (.*)/g) {
open SCRIVI, ">>", $xchatdir."/ocebot.txt";
open SCRIVI2, ">>", $xchatdir."/ocepack.txt";
print SCRIVI "$2\n";
print SCRIVI2 "$1\n";
close SCRIVI2;
close SCRIVI;
Xchat::print("9,1___________________\n4,1Risultato n.°:9,1 $i\n4,1Pack:9,1 $1\n4,1Bot:9,1 $2\n4,1Dimensioni:9,1 $3\n4,1File:9,1 $4\n9,1___________________\n");
$i++;
}
La stessa espressione sul primo indirizzo invece non da buon esito, mi raggruppa le colonne a due a due e lascia le ultime due vuote. Prova pure...
Aggiungo una domanda: ho letto qualcosa sulle regexp ma da nessuna parte ho trovato una spiegazione alla 'm' iniziale e alla 'g' finale. Cosa sono?