Ciao a tutti
un amico mi ha chiesto un programmino che scorre files pdf ed estrapola alcune informazioni. questi pdf sono creati da un SW su cui non posso intervenire. I pdf sono strutturati come nell'allegato (estremamente semplificato)
A me interessa reperire, nell'esempio, i dati 3,8 e 9.
Per farlo ho usato il framework iText
Il problema è che (penso) la struttura dei pdf viene continuamente modificata, ad esempio: a volte se scorro i Token su un file pdf mi arrivano in sequenza 0 I, 9 H, 8 G etc, altre 0 9 8 7 6 I H G F E 1 A etc.
Mi chiedo se sia possibile verificare la presenza di "segnalibri", qualcosa che mi dica "ehi sono A" così da non dover ogni volta cercare di capire la sequenza.
Avete esperienza con iText per fare ciò?
L'avete fatto con altri framework?
allegato:
![]()

Rispondi quotando