Visualizzazione dei risultati da 1 a 10 su 10
  1. #1

    Come posso estrarre il testo da un file .pdf???

    Come posso estrarre il testo da un file .pdf???

  2. #2

    Re: Come posso estrarre il testo da un file .pdf???

    Originariamente inviato da carmineabomb
    Come posso estrarre il testo da un file .pdf???
    sei su so windows o linux? su linux ci sono degli ottimi tool, ma dubito che sul server sono installati

    se vuoi, con poco lavoro, puoi scriverti un codice che ti disassembli i pdf estraendoti solo il testo

    se apri un file pdf con un editor di testo tipo context potrai leggere il contenuto e potrai vedere che non sono cosi complessi

    se scarichi dal sito dell'adobe le referenze puoi farti il parser e costruire tutto quello che ti serve
    The fastest Redis alternative ... cachegrand! https://github.com/danielealbano/cachegrand

  3. #3
    sono su windows xp service pack 2 il server lo tengo in locale e quindi posso installare quello ke voglio!c'è qualke toll per windows???

  4. #4
    ci dovrebbe essere la versione winzoz di questi tool

    oggi pome ti dico come si chiamano che devo fuggire a lavoro ^^

    cmq credo sia pdftohtml e fa parte di un pacchetto, cmq oggi guardo
    The fastest Redis alternative ... cachegrand! https://github.com/danielealbano/cachegrand

  5. #5

    Re: Re: Come posso estrarre il testo da un file .pdf???

    Originariamente inviato da daniele_dll
    se apri un file pdf con un editor di testo tipo context potrai leggere il contenuto e potrai vedere che non sono cosi complessi
    :master: :master:

    non ti confondi con gli rtf?
    i pdf se li apro vedo un casino incredibile

  6. #6

    Re: Re: Re: Come posso estrarre il testo da un file .pdf???

    Originariamente inviato da bubu77
    :master: :master:

    non ti confondi con gli rtf?
    i pdf se li apro vedo un casino incredibile
    Anke io vedo un casino secondo me ti sei confuso con gli rtf ke sono anke molto + leggeri!!!Cmq grazie oggi pomeriggio farò una ricerca del tool oea devo scappare!!!

  7. #7
    :rollo: :rollo:

    il file pdf, se non sono compressi, sono un insieme di comandi
    la compressione, se non erro, è fatta con le GZIP, e il flag che specifica la compressione sta negli header

    aprite qualche pdf semplice con context cosi vedete
    The fastest Redis alternative ... cachegrand! https://github.com/danielealbano/cachegrand

  8. #8
    a me servirebbe un tools o uno script ke trasforma delle tabelle di file .pdf in tabelle html, in modo ke ci posso lavorare con + semplicità

  9. #9
    allora uno si chiama

    pdftotext

    ed è capace anche su supportare un layout (basta che poi lo visualizzi usando il tag pre) mentre per trasformarlo proprio in html hai bisogno di pdf2ps e ps2html
    The fastest Redis alternative ... cachegrand! https://github.com/danielealbano/cachegrand

  10. #10
    ok grazie mo devo andare a scuola quando torno farò una ricerca...
    grazie ancora

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.