Originariamente inviato da Mr.Mime
Salve a tutto di nuovo.
Dopo aver risolto i problemi con McKoi grazie al vostro aiuto, torno da voi chiedendo consigli sulla seconda fare sel software che devo implementare ovvero la gestione dei PDF.
L'esigenza è quella di riuscire ad ottenere il maggior numero di informazioni automaticamente, a partire da un PDF. Per informazioni intendo il titolo del documento, la versione, l'autore ecc... (considerando anche la differenza tra le due. Per esempio posso avere un documento pdf che contiene un paper scritto da Mickey Mouse intitolato "Topolinia in serie A" ma l'autore del file vero e proprio è un altro ovvero quello che ha creato il file vero e proprio)
Ho cercato su questo forum tutto ciò che era inerente Java ed i PDF ma ho trovato solo qualche post su come stamparli (interessanti comunque) ed alcuni altri che parlavano di conversioni tra pdf ed rtf con purtroppo pochi post di risposta.
La mia esigenza è quella di poter:
1. Recuperare i metadati del pdf ovvero i dati contenuti nei tag del PDF (come gli id tag degli MP3);
2. Riuscire in qualche modo a fare un parsing del documento per cercare di caprirne più informazioni possibili, con magari anche il recupero delle informazioni sulle eventuali indicizzazioni, elenco capitoli ecc...)
Ho guardato un po' sulla rete ma a parte una applicazione da 6000$, ho trovato solo qualche piccola classe come PDFTextStream che tra l'altro mi tocca richiamare da remoto e questo non mi va bene dato che devo fare una applicazione stand alone.
Mi rivolto quindi alla vostra esperienza.
Grazie e alla prossima...