Salve raga,
sapete dirmi come potrei creare un'applicazione in grado di cercarmi parole presenti all'interno di PDF?
Esistono classi o funzioni particolari?
Grazie in anticipo
Salve raga,
sapete dirmi come potrei creare un'applicazione in grado di cercarmi parole presenti all'interno di PDF?
Esistono classi o funzioni particolari?
Grazie in anticipo
Utilizza un tool esterno come pdftotext.
Grazie per la risposta filippo.toso però quello che mi chiedo è:
se io creo un motore di ricerca in grado di cercarmi tutti i pdf che contengono la parola "ciccio" credo sia improponibile fare una scansione di un db di PDF (che supponiamo essere pari a 1000 unità), per ciascuno utilizzare la funzione pdftotext e restituire un risultato...quanti millenni dovrebbe metterci l'applicazione?![]()
Basta usare un po' di logica.
Utilizza il tool di conversione in fase di indicizzazione NON in quella di ricerca.
La ricerca andrai ad eseguirla su un indice FULL TEXT contenente il contenuto testuale dei PDF.
Ok ci sto, il suggerimento mi piace, effettivamente ho dato una risposta troppo veloce![]()
Hai mica questo tool sotto mano?
Sul web non trovo nulla
Aprendo Google e digitando pdftotext si trova tutto ...Originariamente inviato da Kaesar83
Hai mica questo tool sotto mano?
Sul web non trovo nulla
Se l'avessi trovato di sicuro non chiederei aiuto...cmq va bene uguale, hai fatto assai, non sprecarti troppo!![]()
http://www.google.com/search?q=pdftotext
Primo risultato: http://www.foolabs.com/xpdf/download.html
Un tool veramente introvabile ...
Già vista e rivista ma credevo ci fosse altro...se uso hosting normali quella libreria è praticamente inutilizzabile.
Grazie cmq![]()