Salve ragazzi, per un progetto universitario sto tentando di realizzare un database semantico che alla richiesta dell'utente fornisca oltre ai risultati contenenti le parole cercate anche delle parole semanticamente vicine es: se cerco stampella deve avere una forte probabilità (oltre ai risultati connettenti la parola stampella) anche l'uscita della parola scarpa ortopedica, oppure appendiabiti (dato che anche la sinonimia viene presa in considerazione).
Per cui la mia idea di base (dal momento che non posso emulare google )
è stata quella di inserire nel database una serie di parole le quali possono appartenere ad un gruppo di pertinenza come per esempio l'informatica la medicina et cetera, che a loro volta possono essere inclusi in altri gruppi "padri", e le parole possono avere tra loro dei sinonimi.
Ora secondo voi quale potrebbe essere un buon algoritmo di calcolo di "vicinanza" semantica tra le parole?
Avevo pensato che come primo step dovrei innanzitutto intepretare le singole parole digitate nel form di ricerca dell'utente e trovare il gruppo di appartenenza che conteneva il numero massimo di parole tra quelle digitate...