L'identifinder è un tool di machine learning per il riconoscimento di named entity, ovvero riconosce in un testo in base ad alcune regole Nomi di persone, luoghi, organizzazioni, date etc..
la fase di learning genera 2 file in cui sono contenuti dei valori che verranno utilizzati per il calcolo delle probabilità.
la mia applicazione prende il testo da etichettare, legge parola per parola e tramite il calcolo delle probabilità basato sulla parola letta e su quella precedente, riconosce se è una parola interessante ai fini dell'etichettatura o meno.
il mio problema è di riuscire ad arrivare a prestazioni almeno pari a quelle che si hanno con la stessa applicazione in c, e volevo sapere se è possibile riuscire a fare questa cosa..