Originariamente inviato da rsdpzed
questa, che è una funzione che google implementa su larga scala e in multilingua, secondo me è il risultato di un algoritmo genetico.
Dal post non è chiaro se al momento del controllo tu hai sia la stringa esatta che la tringa potenzialmente simile che vuoi verificare, pare di si.
Volendo si puo provare a fare qualcosa di rudimentale:
In base alla lunghezza della stringa totale ti calcoli un range di lunghezze di sottostringhe da controllare significativo, diciamo nel caso specifico 4 - 5.
Suddividi la stringa da controllare in tante sottostringhe da 4 e poi in tante sottostringhe da 5 e le inserisci in una lista di Test.
Cerca per ogni sottostringa della lista se c'è un corrispondente nella stringa originale.
Se la media pesata (i test da 5 valgono piu dei test da 4) dei test passati supera un certo target, diciamo 70% sul totale dei test, allora la stringa corrisponde.
Spero sia un buon inizio da cui partire, ovviamente questo presuppone che tu abbia la stringa esatta con cui controllare quella potenzialmente simile.