Ciao!
dovrei iniziare un progetto in java per cui dato un documento in ingresse (doc,pdf,etc) il programma legge il testo contenuto nel documento e lo analizza restituendo l 'argomento trattato nel testo....il testo sono riuscito ad estrarlo utilizando le librerie Apache Tika che sono molto comode...ora ho in una stringa il contenuto del mio documento...
ho letto qualcosa sui classificatori NaiveBayes e sulle librerie Classifier4j per effettuare l'analisi , sono sulla strada giusta?
avete esempi da consigliare?
grazie mille in anticipo!!!