Visualizzazione dei risultati da 1 a 8 su 8
  1. #1
    Utente di HTML.it
    Registrato dal
    May 2019
    Messaggi
    51

    Lettura file pdf con libreria PdfParser

    codice HTML:
    <form action="read_php.php" method="post" enctype="multipart/form-data">    
    <div class="form-input">       
    <label for="pdf_file">PDF File</label>        
    <input type="file" name="pdf_file" placeholder="Select a PDF file" required="">    
    </div>    
    <input type="submit" name="submit" class="btn" value="Extract Text"></form>
    Codice PHP:
    $pdfText ''; if(isset($_POST['submit'])){        
    if(!empty(
    $_FILES["pdf_file"]["name"])){              
    $fileName basename($_FILES["pdf_file"]["name"]);         
    $fileType pathinfo($fileNamePATHINFO_EXTENSION);                           
    $allowTypes = array('pdf');         
    if(
    in_array($fileType$allowTypes)){                       
    include 
    'vendor/autoload.php';                                   
    $parser = new \Smalot\PdfParser\Parser();                           
    $file $_FILES["pdf_file"]["tmp_name"];              
                
    $pdf $parser->parseFile($file);              
                
    $text $pdf->getText();                           
    $pdfText nl2br($text);         
    }else{             
    $statusMsg '<p>Sorry, only PDF file is allowed to upload.</p>';        
     }     
    }
    else{         
    $statusMsg '<p>Please select a PDF file to extract text.</p>';    
     } }  
    echo 
    $pdfText
    sto utilizzando questo codice per leggere il contenuto di un file pdf e funziona, ho però un problema, nello specifico il pdf è un CUD, leggo le intestazioni della pagina ma non riesco a leggere i campi del pdf, nel dettaglio non riesco a leggere il codice fiscale, ci sono altre librerie oppure devo implementare qualcosa in questa?
    Ultima modifica di desila98; 15-05-2023 a 22:39

  2. #2
    Utente di HTML.it
    Registrato dal
    May 2019
    Messaggi
    51
    Il file sembra sia di tipo a, criptato

  3. #3

  4. #4
    Utente di HTML.it
    Registrato dal
    May 2019
    Messaggi
    51
    Grazieeee.
    Sto provando ad utilizzare questa libreria, ho installato la libreria con composer, è ho poi caricato la cartella vendor sul mio server.
    Ho preso lo script
    codice:
    <?php
      
      use mikehaertl\pdftk\Pdf;
    
    
    // Get data
    $pdf = new Pdf('/path/my.pdf');
    $data = $pdf->getData();
    if ($data === false) {
        $error = $pdf->getError();
    }
    
    
    // Get form data fields
    $pdf = new Pdf('/path/my.pdf');
    $data = $pdf->getDataFields();
    if ($data === false) {
        $error = $pdf->getError();
    }
    
    
    // Get data as string
    echo $data;
    $txt = (string) $data;
    $txt = $data->__toString();
    
    
    // Get data as array
    $arr = (array) $data;
    $arr = $data->__toArray();
    $field1 = $data[0]['Field1'];
    
    
    ?>
    ma non funziona e nella consolle ho questo errore: non-JS module files deprecated

  5. #5
    Utente di HTML.it
    Registrato dal
    May 2019
    Messaggi
    51
    Qualche altra libreria da poter utilizzare?

  6. #6
    Utente di HTML.it
    Registrato dal
    Feb 2024
    Messaggi
    3
    Quote Originariamente inviata da desila98 Visualizza il messaggio
    Grazieeee.
    Sto provando ad utilizzare questa libreria, ho installato la libreria con composer, è ho poi caricato la cartella vendor sul mio server.
    Ho preso lo script
    codice:
    <?php
      
      use mikehaertl\pdftk\Pdf;
    
    
    // Get data
    $pdf = new Pdf('/path/my.pdf');
    $data = $pdf->getData();
    if ($data === false) {
        $error = $pdf->getError();
    }
    
    
    // Get form data fields
    $pdf = new Pdf('/path/my.pdf');
    $data = $pdf->getDataFields();
    if ($data === false) {
        $error = $pdf->getError();
    }
    
    
    // Get data as string
    echo $data;
    $txt = (string) $data;
    $txt = $data->__toString();
    
    
    // Get data as array
    $arr = (array) $data;
    $arr = $data->__toArray();
    $field1 = $data[0]['Field1'];
    
    
    ?>
    ma non funziona e nella consolle ho questo errore: non-JS module files deprecated
    Ho lo stesso problema con il codice, sei riuscito a risolverlo?

  7. #7
    Utente di HTML.it
    Registrato dal
    Mar 2024
    Messaggi
    1
    good

  8. #8
    Utente di HTML.it
    Registrato dal
    Feb 2024
    Messaggi
    3
    Quote Originariamente inviata da desila98 Visualizza il messaggio
    codice HTML:
    <form action="read_php.php" method="post" enctype="multipart/form-data">    
    <div class="form-input">       
    <label for="pdf_file">PDF File</label>        
    <input type="file" name="pdf_file" placeholder="Select a PDF file" required="">    
    </div>    
    <input type="submit" name="submit" class="btn" value="Extract Text"></form>
    Codice PHP:
    $pdfText ''; if(isset($_POST['submit'])){        
    if(!empty(
    $_FILES["pdf_file"]["name"])){              
    $fileName basename($_FILES["pdf_file"]["name"]);         
    $fileType pathinfo($fileNamePATHINFO_EXTENSION);                           
    $allowTypes = array('pdf');         
    if(
    in_array($fileType$allowTypes)){                       
    include 
    'vendor/autoload.php';                                   
    $parser = new \Smalot\PdfParser\Parser();                           
    $file $_FILES["pdf_file"]["tmp_name"];              
                
    $pdf $parser->parseFile($file);              
                
    $text $pdf->getText();                           
    $pdfText nl2br($text);         
    }else{             
    $statusMsg '<p>Sorry, only PDF file is allowed to upload.</p>';        
     }     
    }
    else{         
    $statusMsg '<p>Please select a PDF file to extract text.</p>';    
     } }  
    echo 
    $pdfText
    sto utilizzando questo codice per leggere il contenuto di un file pdf e funziona, ho però un problema, nello specifico il pdf è un CUD, leggo le intestazioni della pagina ma non riesco a leggere i campi del pdf, nel dettaglio non riesco a leggere il codice fiscale, ci sono altre librerie oppure devo implementare qualcosa in questa?
    La crittografia viene applicata semplicemente in questo caso.
    Questo è abbastanza facile se si sa già come fare. Mi è stato consigliato da un collega qui https://pdfguru.com/it/organize-pdf per modificare o convertire molto facilmente, e funzionano con diversi formati oltre che con i file pdf. Forse può essere utile anche a voi.

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.