devo implementare, anzi, ho implementato un banale algoritmo per il confronto di dati duplicati ma è troppo lento. Si tratta di confrontare più di 800000 stringhe e il metodo che uso io, prendi la prima stringa e confrontala con le altre n+1, poi la seconda con n+2 etc... impiega almeno 8 ore di elaborazione: che algoritmi esistono più performanti?

grazie