Confronto tra files di testo

**zeno78** · 22-07-2005, 16:30

Salve a tutti,

vorrei creare uno scriptino che faccia un confronto tra il contenuto di 2 files di testo di questo tipo:

FILE 1:

aaaa bbbb cccc dddd eeee
1111 2222 3333 4444 5555
xxxx xxxx xxxx xxxx xxxx

FILE2:

aaaa
yyyy
wwww

Il confronto deve funzionare in questo modo:
-verificare se in una qualsiasi riga del file 2 c'è qualche elemento che corrisponde ad un elemento di una qualsiasi riga del file 1 ed in caso affermativo riporta il contenuto (intero) della riga dove è avvenuta la corrispondenza del file 1 in un terzo fle di testo.

Ho provato ad utizzare due cicli foreach annidati ottenendo il risultato voluto:

open (TESTO1, "testo1.txt")||die "impossibile aprire testo1.txt:$!\n";
open (TESTO2, "testo2.txt")||die "impossibile aprire testo2.txt:$!\n";
open (TESTO_DEF, ">>testo_output.txt");
@testo_confronto1=<TESTO1>;
@testo_confronto2=<TESTO2>;
close (TESTO1);
close (TESTO2);

foreach $linea(@testo_confronto1){
foreach $line(@testo_confronto2){
if ($linea=~m/$line/g){
print TESTO_DEF "$line";
}
else{
print "escluso:$linea\n";
}
}
}
close (TESTO_DEF);

Mi chiedevo però se esiste una tecnica migliore per ottenere lo stesso risultato.
Grazie 1000!

zeno

**shishii** · 23-07-2005, 11:36

In generale si ottengono notevoli miglioramenti con:

codice:

open (TESTO1, "testo1.txt")||die "impossibile aprire testo1.txt:$!\n"; 
open (TESTO2, "testo2.txt")||die "impossibile aprire testo2.txt:$!\n"; 
open (TESTO_DEF, ">>testo_output.txt"); 

while ($linea = <TESTO1>){ 
while ($line = <TESTO2>){ 
if ($linea=~m/$line/g){ 
print TESTO_DEF "$line"; 
} 
else{ 
print "escluso:$linea\n"; 
} 
} 
} 

close (TESTO1); 
close (TESTO2); 
close (TESTO_DEF);

questo perchè si evita il caricamento dei file in memoria.

Devi inoltre gestire i lock.

**Mich_** · 25-07-2005, 08:53

Ho l'impressione che usando il comando "grep" del sistema operativo (linux) si ottimizzi ancora meglio: si usa un programma dedicato e compilato e gia` ottimizzato.

**shishii** · 25-07-2005, 16:23

anche se è difficile crederlo, pare che il motore delle RE di Perl sia molto più efficiente di grep e famiglia. L'ho letto su pubblicazioni molto serie.

Discussione: Confronto tra files di testo

Strumenti discussione

Ricerca discussione

Visualizza

Confronto tra files di testo

Permessi di invio