codice HTML:
<form action="read_php.php" method="post" enctype="multipart/form-data">
<div class="form-input">
<label for="pdf_file">PDF File</label>
<input type="file" name="pdf_file" placeholder="Select a PDF file" required="">
</div>
<input type="submit" name="submit" class="btn" value="Extract Text"></form>
Codice PHP:
$pdfText = ''; if(isset($_POST['submit'])){
if(!empty($_FILES["pdf_file"]["name"])){
$fileName = basename($_FILES["pdf_file"]["name"]);
$fileType = pathinfo($fileName, PATHINFO_EXTENSION);
$allowTypes = array('pdf');
if(in_array($fileType, $allowTypes)){
include 'vendor/autoload.php';
$parser = new \Smalot\PdfParser\Parser();
$file = $_FILES["pdf_file"]["tmp_name"];
$pdf = $parser->parseFile($file);
$text = $pdf->getText();
$pdfText = nl2br($text);
}else{
$statusMsg = '<p>Sorry, only PDF file is allowed to upload.</p>';
}
}
else{
$statusMsg = '<p>Please select a PDF file to extract text.</p>';
} }
echo $pdfText;
sto utilizzando questo codice per leggere il contenuto di un file pdf e funziona, ho però un problema, nello specifico il pdf è un CUD, leggo le intestazioni della pagina ma non riesco a leggere i campi del pdf, nel dettaglio non riesco a leggere il codice fiscale, ci sono altre librerie oppure devo implementare qualcosa in questa?