Visualizzazione dei risultati da 1 a 5 su 5
  1. #1

    [C#] Estrarre testo da PDF

    Salve, avrei bisogno di riuscire ad estrarre da un pdf tutte le porzioni di testo, cercando di portarmi dietro più informazioni possibili (dimensione testo, font, colore, background ecc... e se possibile la posizione che occupa nel pdf (coordinare, dimensione o quel che sia)).
    Quindi la mia domanda è, qualcuno conosce una libreria free per i pdf che possa aiutarmi ad iniziare in questa cosa?
    O in alternativa una qualche idea su come interpretare il formato dei pdf da codice...
    Grazie mille in anticipo a chiunque mi dia attenzione!!!

  2. #2
    Utente di HTML.it
    Registrato dal
    Jan 2011
    Messaggi
    237
    Ciao.
    Dopo una breve ricerca ti direi che quello che chiedi è si fattibile, ma con librerie a pagamento.
    Se invece vuoi rimanere sul "FREE", so che questa libreria per creare PDF è molto valida (almeno per me).
    Spulciando un po' ho trovato questo link http://forum.pdfsharp.net/viewtopic.php?p=4010#p4010
    dove si parla di una classe textExtractor. Non ho provato il codice ma sembra valida..
    Ciao!

  3. #3
    Grazie mille, provato e funziona! Ma non riesco a estrarre tutte le informazioni che mi servono...
    A questo punto apro i miei orizzonti, che librerie a pagamento potreste consigliarmi per il mio problema?

  4. #4
    Ciao, vedi anche questa libreria free... http://sourceforge.net/projects/itextsharp/ è veramente valida..
    Jupynet

  5. #5
    Ho provato, ma a me servirebbe davvero qualcosa per poterne estrarre il contenuto e le informazioni relative ad esso, e a questo punto anche se è a pagamento va benissimo

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.