Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 13
  1. #1
    Utente di HTML.it
    Registrato dal
    Jul 2003
    Messaggi
    205

    convertire .pdf in xls o csv

    Ciao

    avete uno script (vbs andrebbe benissmo) per convertire un file pdf in csv o xls?

    grazie

  2. #2
    Utente di HTML.it L'avatar di oregon
    Registrato dal
    Jul 2005
    residenza
    Roma
    Messaggi
    36,476
    Non basta uno script ... e comunque non si fanno richieste di codice pronto all'uso sul forum...
    No MP tecnici (non rispondo nemmeno!), usa il forum.

  3. #3
    Utente di HTML.it L'avatar di MySQL
    Registrato dal
    May 2015
    Messaggi
    729
    La risposta davvero breve è che non riesci ovviamente con uno script.
    Il punto chiave è se parliamo di un PDF immagine o un PDF testo.
    Nel primo caso ti serve un OCR (ce n'è uno gratuito ma non è un granchè), oppure uno a pagamento (ce ne sono un paio validi).
    Nell'ipotesi più semplice di PDF testo puoi usare invece il programmello eseguibile pdftotext (non so se è gratuito)

  4. #4
    Utente di HTML.it
    Registrato dal
    Jul 2003
    Messaggi
    205
    Ciao
    si è un pdf testuale...tipo una fattura...
    Non volevo avere uno script già fatto..volevo solo sapere se qualcuno ha già fatto qualche cosa di simile...

  5. #5
    Quote Originariamente inviata da elly00 Visualizza il messaggio
    Non volevo avere uno script già fatto..volevo solo sapere se qualcuno ha già fatto qualche cosa di simile...
    Abbiamo esattamente uno script del genere che prende un PDF di fatture esportato dal gestionale (che contiene N fatture diverse), lo converte in testo, deduce con regex dove inizia e finisce ciascuna fattura e l'indirizzo e-mail del cliente, spezza il pdf e spedisce ogni fattura al cliente giusto. È un po' una tacconata ma il gestionale che usano in ufficio fa schifo e alla fine questa era la soluzione più semplice (in effetti non ho ancora mai visto un gestionale che non facesse schifo, ma questo è un altro discorso ).

    L'estrazione del testo è fatta con pdftotext (con l'opzione -layout), il resto è in Python (con CherryPy per la parte di interfaccia web).
    Amaro C++, il gusto pieno dell'undefined behavior.

  6. #6
    Utente di HTML.it L'avatar di oregon
    Registrato dal
    Jul 2005
    residenza
    Roma
    Messaggi
    36,476
    Anche noi ne abbiamo uno, in vbs con pdftotext ...
    No MP tecnici (non rispondo nemmeno!), usa il forum.

  7. #7
    Utente di HTML.it
    Registrato dal
    Jun 2015
    Messaggi
    12
    Ma in giro si trovano api a cui potersi appoggiare per un eventuale webservice che faccia la conversione da PDF ad altri formati?
    Stavo pensando ad un modo su come risparmiare un po' di soldi senza sviluppare ex-novo un nuovo script...

  8. #8
    Utente di HTML.it L'avatar di MySQL
    Registrato dal
    May 2015
    Messaggi
    729
    Quote Originariamente inviata da CBF2k15 Visualizza il messaggio
    Ma in giro si trovano api a cui potersi appoggiare per un eventuale webservice che faccia la conversione da PDF ad altri formati?
    Stavo pensando ad un modo su come risparmiare un po' di soldi senza sviluppare ex-novo un nuovo script...
    pdftotext.
    Risparmio effettuato.

  9. #9
    Quote Originariamente inviata da MItaly Visualizza il messaggio
    Abbiamo esattamente uno script del genere che prende un PDF di fatture esportato dal gestionale (che contiene N fatture diverse), lo converte in testo, deduce con regex dove inizia e finisce ciascuna fattura e l'indirizzo e-mail del cliente, spezza il pdf e spedisce ogni fattura al cliente giusto. È un po' una tacconata ma il gestionale che usano in ufficio fa schifo e alla fine questa era la soluzione più semplice (in effetti non ho ancora mai visto un gestionale che non facesse schifo, ma questo è un altro discorso ).

    L'estrazione del testo è fatta con pdftotext (con l'opzione -layout), il resto è in Python (con CherryPy per la parte di interfaccia web).
    potrebbe interessarmi una cosa del genere.
    ma non ho capito punto.
    spezza il pdf e spedisce ogni fattura al cliente giusto: la spedisce in che formato?

  10. #10
    Utente di HTML.it L'avatar di MySQL
    Registrato dal
    May 2015
    Messaggi
    729
    Quote Originariamente inviata da fermat Visualizza il messaggio
    potrebbe interessarmi una cosa del genere.
    ma non ho capito punto.
    spezza il pdf e spedisce ogni fattura al cliente giusto: la spedisce in che formato?
    Il formato che vuoi.
    Devi fare un parser specifico PER OGNI tipo di documento (fattura).
    Una volta convertito in testo, con -layout e/o -raw (talvolta servono entrambi!) devi caricare il testo, poi "in qualche modo" capire dove sono i documenti, e leggerne i dati.
    Niente di fantascientifico, normalmente un'oretta per ogni tipo di documento

    Se ti aspetti qualcosa di "magico" che, dato un qualsiasi PDF contenente un qualsiasi tipo di documenti, e "magicamente" ritorni non so che... mi spiace, ma ci vuole "olio di gomito"

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.