Ciao ragazzi,
sto facendo un progetto di NLP in java e mi interesserebbe ricavare delle informazione da wikipedia.
In pratica dovrei scrivere codice per estrarre i link da un articolo wikipedia (per esempio http://en.wikipedia.org/wiki/Boston) presenti solo nella sezione di introduzione e nella sezione Geography.
Io sono riuscita, con le api jsoup, a estrarre tutti i link da tutta la pagina wikipedia e non solo dalle sezioni cui sono interessata (introduzione e geography).
Qualcuno saprebbe aiutarmi?
Grazie