Visualizzazione dei risultati da 1 a 5 su 5

Discussione: FILE PDF

  1. #1

    FILE PDF

    Salve a tutti

    Ho bisogno di verificare se una stringa e' contenuta in un file PDF ("generato" con PDFCREATOR).
    Mi serve, quindi, aprire il file, verificare se la stringa e' presente, leggere <n> caratteri a seguire dalla stringa cercata e richiudere il file.

    Non essendo ancora molto pratico di .NET non sono riuscito ad utilizzare quanto gia' disponibile gratuitamente. Cerco, pertanto, un sistema in ASP "classico".

    Ho visto FPDF, ma a quanto ho capito consente di "creare" e manipolare un file PDF e non "solamente" aprirlo e leggerne il contenuto.

    Grazie!

  2. #2
    Utente di HTML.it L'avatar di Baol74
    Registrato dal
    Jul 2002
    Messaggi
    2,004
    in asp non è possibile (o meglio, è possibile se installi un oggetto com). I pdf solitamente sono compressi in alcune parti, compreso il testo.
    Per effettuare una ricerca devi prendere gli "stream" testuali, decomprimerli e cercare

  3. #3
    Grazie!

    "stream" testuali, decomprimerli e cercare ?????

    Cioe?

    (Scusa la mia ignoranza)

  4. #4
    Utente di HTML.it L'avatar di Baol74
    Registrato dal
    Jul 2002
    Messaggi
    2,004
    Se apri un pdf con un editor di testo, troverai spesso la sequenza
    codice:
    stream
    .
    .
    endstream
    tra queste due parole chiave vengono inseriti i contenuti del pdf.
    I contenuti possono essere o un testo , o un'immagine.

    a Te interesseranno quelli che iniziano per <</Type /Page

    Questi contenuti sono compressi , solitamente con un algoritmo gz.
    E quindi vedrai una cosa del genere:

    codice:
    stream
    xœ•Œ1
    €0û¼b?à™»äôÞ`'>@„4
    já÷D;Ùb—…Aç<i‹Óm£_0¤¢J,¨žÞgŒXËËŸóî‹
    T¢(¦ÅÕCbÉõY˜Éø¿µpüÑJÑ^^ñ%¯
    endstream
    Se devi effettuare una ricerca, prima devi prendere il contenuto tra stream e endstream (facile) poi nel caso sia compresso (questo accade il 99% delle volte, troverai il tag stream preceduto da <</Filter /FlateDecode )devi decomprimerlo.

    Una volta decompresso avrai il testo (più o meno), una cosa del genere:

    codice:
    stream
    2 J
    0.57 w
    BT /F1 12.00 Tf ET
    q 85.04 0 0 38.71 28.35 774.83 cm /I1 Do Q
    BT /F1 6.00 Tf ET
    q 0.620 0.620 0.620 rg BT 510.90 808.74 Td (Documento generato) Tj ET Q
    q 0.620 0.620 0.620 rg BT 534.58 802.74 Td (da Lorenzo) Tj ET Q
    q 0.620 0.620 0.620 rg BT 504.89 796.74 Td (il 23.03.2005 alle 09:28) Tj ET Q
    q 0.620 0.620 0.620 rg BT 543.25 790.74 Td (Pagina 1) Tj ET Q
    BT /F1 12.00 Tf ET
    0.000 G
    endstream
    Di questa parte, devi prendere solo il testo tra parentesi.

    Se posso darti un cosiglio, prova a cercare degli script php.

  5. #5
    Gentilisimmo!

    Provero' a documentarmi meglio e spero di trovare la soluzione senza essere costretto ad utilizzare "component" non gratuiti. A pagamento ne ho trovati parecchi.

    In ogni caso accetto suggerimenti o "dritte" di qualuque natura e spero di poter ricambiare, presto e in qualche modo, la cortesia.

    Grazie!!!

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.