[C#] Estrarre testo da PDF

**Rebellion545** · 30-11-2013, 12:24

Salve, avrei bisogno di riuscire ad estrarre da un pdf tutte le porzioni di testo, cercando di portarmi dietro più informazioni possibili (dimensione testo, font, colore, background ecc... e se possibile la posizione che occupa nel pdf (coordinare, dimensione o quel che sia)).
Quindi la mia domanda è, qualcuno conosce una libreria free per i pdf che possa aiutarmi ad iniziare in questa cosa?
O in alternativa una qualche idea su come interpretare il formato dei pdf da codice...
Grazie mille in anticipo a chiunque mi dia attenzione!!!

**renygade** · 02-12-2013, 11:08

Ciao.
Dopo una breve ricerca ti direi che quello che chiedi è si fattibile, ma con librerie a pagamento.
Se invece vuoi rimanere sul "FREE", so che questa libreria per creare PDF è molto valida (almeno per me).
Spulciando un po' ho trovato questo link http://forum.pdfsharp.net/viewtopic.php?p=4010#p4010
dove si parla di una classe textExtractor. Non ho provato il codice ma sembra valida..
Ciao!

**Rebellion545** · 11-12-2013, 11:29

Grazie mille, provato e funziona! Ma non riesco a estrarre tutte le informazioni che mi servono...
A questo punto apro i miei orizzonti, che librerie a pagamento potreste consigliarmi per il mio problema?

**jupynet** · 11-12-2013, 17:38

Ciao, vedi anche questa libreria free... http://sourceforge.net/projects/itextsharp/ è veramente valida..

**Rebellion545** · 30-12-2013, 18:59

Ho provato, ma a me servirebbe davvero qualcosa per poterne estrarre il contenuto e le informazioni relative ad esso, e a questo punto anche se è a pagamento va benissimo

Discussione: [C#] Estrarre testo da PDF

Strumenti discussione

Ricerca discussione

Visualizza

[C#] Estrarre testo da PDF

Permessi di invio