Il formato che vuoi.
Devi fare un parser specifico PER OGNI tipo di documento (fattura).
Una volta convertito in testo, con -layout e/o -raw (talvolta servono entrambi!) devi caricare il testo, poi "in qualche modo" capire dove sono i documenti, e leggerne i dati.
Niente di fantascientifico, normalmente un'oretta per ogni tipo di documento
Se ti aspetti qualcosa di "magico" che, dato un qualsiasi PDF contenente un qualsiasi tipo di documenti, e "magicamente" ritorni non so che... mi spiace, ma ci vuole "olio di gomito"![]()


Rispondi quotando