Originariamente inviato da Kreator
Vi spiego subito cosa devo fare.
Ammettiamo che ho due file uguali (possono essere o .mp3 o .avi) però questi file sono chiamati con nomi di file diversi e ammettiamo che sia diversa anche la dimensione dei file di qualche byte(ad esempio per ragioni di campionamento).
La domanda è questa come posso fare per riconoscre che i due file sono identici ??
Vedi la risposta molto esaustiva di oregon.

Comunque aggiungo io, che non è affatto "banale" fare questo tipo di comparazioni. Prendiamo per esempio i file mp3. I software P2P tipicamente si limitano a calcolare l'hash (es. SHA-1) del file per stabilire se 2 file sono uguali. Questa è la soluzione più veloce e pratica. Ma basta che chi mette sulla rete P2P il file abbia cambiato anche solo 1 tag del brano (es. autore) per far sì che 2 brani, seppur uguali, siano visti come "diversi" dal sw.
Ecco perché sulle reti P2P capita di trovare decine (se non centinaia) di versioni dello stesso brano/file!!

Fare una estrazione più accurata è certamente possibile. Conoscendo bene nei dettagli il formato (es. mp3) si può estrarre solo lo "stream" che contiene i dati audio. Ma anche qui non è banale. Basta che la codifica sia anche solo leggermente diversa (parametri diversi passati all'encoder) che i 2 stream sono comunque diversi.

Insomma ... è tutto da vedere. Spero di non essere andato troppo OT, nel qual caso, mi scuso.