Visualizzazione dei risultati da 1 a 7 su 7

Discussione: Ricerca testo nei pdf

  1. #1
    Utente di HTML.it
    Registrato dal
    Sep 2001
    Messaggi
    100

    Ricerca testo nei pdf

    Salve a tutti .. ho un problemino.. nn riesco a fare la ricerca dentro ai file pdf. Nel forum ho trovato una discussione che riportava al sito http://www.ozoneasylum.com/21295
    Ho scaricato l'esempio.. provato .. ma .. il risultato è una pagina vuota indicante che il browser nn mi può visualizzare la pagina!

    Help me Please!


    Altri script? Esempi? Guide in italiano?!

    Grazie

  2. #2
    Utente di HTML.it
    Registrato dal
    Apr 2004
    Messaggi
    96
    il casino è che il testo nei pdf è generalmente compresso, ovvero un reader usa in genere un filtro per decodificarne il valore.
    Infatti un pdf può essere anche scritto tutto in ASCII, ma in genere non viene fatto, perché troppo pesante...
    Dovresti avere un motore capace di decodificare la parte binaria compressa... Ma non so né se c'è né dov'è...

  3. #3
    Utente di HTML.it
    Registrato dal
    Sep 2001
    Messaggi
    100
    Dannazione.. questo è un problema piuttosto grave..

    Nn posso convertire in html tutti i doc! sono quasi mille!!

    Inoltre nn faro io gli aggiornamenti al sito ma il mio amico per cui l'ho fatto.. e lui.. nn credo capisca molto di html.

    Infatti volevo fargli un modulo per l'upload in modo ke aggiungeva i doc in pdf (visto ke lui li vuole così) e via.

    Come posso risolvere? Anche xkè lui ha visto questa cosa sul sito della siulp e mi ha detto ke li la ricerca nei pdf funziona..

    Altrimenti dovrei mettere delle keyword nel db per ogni documento e limitare la ricerca a quelle.. ma .. per 1000 pdf ... ci vorrebbe una vita!!!

    Altri consigli?

    (Grazie cmq!)

  4. #4
    Utente di HTML.it
    Registrato dal
    Apr 2004
    Messaggi
    96
    purtroppo in quesot momento non ho il mio pc quindi non posso fare grandi prove
    So solo che certe libreria di creazione PDF in PHP usano gcompress() per comprimere quanto passato in buffer in formato ZLIB. Non credo però sia l'unico formato possibile di compressione in PDF.
    In tal caso potremmo cercare di decomprimere con gzuncompress()... ma va trovato cosa decomprimere, e dove (qualcosa può essere in formato compresso, qualcosa no).
    Al riguardo non c'è praticamente su Internet... ma mi chiedo come faccia GOOGLE a farlo!!!

  5. #5
    Utente di HTML.it
    Registrato dal
    Apr 2004
    Messaggi
    96
    puoi provare questo? magari su un pdf piccolo...

    <?
    $search = "BDCD";
    $dati=file("testo.pdf");
    foreach($dati as $line)
    echo $line;
    ?>

  6. #6
    Utente di HTML.it
    Registrato dal
    Sep 2001
    Messaggi
    100
    Ti ringrazio.. ma cmq c'è un altro problema.. quindi ho deciso di optare per una ricerca meno estesa appoggiandomi alle descriz dei doc nel db.
    Parecchi pdf sn fatti da scansioni di fax che ha ricevuto!

    Come faccio a ricercare del testo in img? eheheh

    Ciao!

  7. #7
    Utente di HTML.it
    Registrato dal
    Apr 2004
    Messaggi
    96
    In che senso cercare del testo in img? Nel DB hai un type img?
    Spiega meglio...
    ciao

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.