Visualizzazione dei risultati da 1 a 6 su 6
  1. #1

    Da pdf a txt...passando per?

    Devo porvi una domanda complessa.
    Ho un file in formato pdf di circa 3000 pagine. Si tratta di una stampa che contiene una rubrica telefonica con un numero di campi x (es. nome, cognome, via, cap, città, cellulare, telefono, fax, email). Vorrei esportare il file in txt per poi importarlo su excel. Qual'è il problema?
    Che ogni record è disposto su due righe anzichè una! Nella prima riga: nome, cognome, via, cap, città; nella seconda: cellulare, telefono, .....)

    Non è che per caso esiste un software che mi permette di riunire il record tutto su una riga?

    grazie!

  2. #2
    Posso dirti che tempo fa ebbi un problema simile, solo che partivo già da un file Excel e dovevo ordinare i dati "unendo" più righe su un'unica, es...
    Da così
    codice:
    uno due tre
    qua cin sei
    set ott nov
    a così
    codice:
    uno due tre qua cin sei set ott nov
    Il problema mi fu risolto da un collega universitario con una macro in Visual Basic.
    Magari cerca un po' nel forum se trovi qualcosa seguendo tale via.

  3. #3
    Utente di HTML.it L'avatar di nicola75ss
    Registrato dal
    Nov 2004
    Messaggi
    12,923

    Re: Da pdf a txt...passando per?

    Originariamente inviato da excel2009
    Devo porvi una domanda complessa.
    Ho un file in formato pdf di circa 3000 pagine. Si tratta di una stampa che contiene una rubrica telefonica con un numero di campi x (es. nome, cognome, via, cap, città, cellulare, telefono, fax, email). Vorrei esportare il file in txt per poi importarlo su excel. Qual'è il problema?
    Che ogni record è disposto su due righe anzichè una! Nella prima riga: nome, cognome, via, cap, città; nella seconda: cellulare, telefono, .....)

    Non è che per caso esiste un software che mi permette di riunire il record tutto su una riga?

    grazie!
    Per iniziare ti consiglio di scaricare Advanced Pdf to Word Converter
    http://www.officeconvert.com/product...erter-free.htm

    Una volta convertito in un file di word facci sapere cosa ne è venuto fuori, nel senso come sono separati i campi (da uno o più spazi, da tabulazioni, carattere di separazione o cos'altro).
    In qualche modo risolviamo.

    edit. Il discorso vale anche nel caso possa fare un semplice copia incolla del pdf su un txt.
    L'ideale per aiutarti sarebbe che postasti le prime righe del txt (ovviamente anche sostituendo i dati sensibili con stringhe fittizie).

  4. #4
    Utente di HTML.it L'avatar di nicola75ss
    Registrato dal
    Nov 2004
    Messaggi
    12,923
    Ho appena fatto una prova con la powershell e funziona alla grande, con tanto di esportazione diretta in csv
    Basta che posti l'esatta struttura del txt e lo si adatta al tuo caso specifico.

  5. #5
    questa cosa interessa anche me. posso sapere come hai risolto? ti ringrazio.

  6. #6
    Utente di HTML.it L'avatar di nicola75ss
    Registrato dal
    Nov 2004
    Messaggi
    12,923
    Originariamente inviato da andrea_kobe
    questa cosa interessa anche me. posso sapere come hai risolto? ti ringrazio.
    Certo. Il file di testo che ho usato per testare lo script è il seguente

    mario, rossi, via roma 20, 11111, roma
    333111111, 101010, 11111, mario@mail.it
    giuseppe, verdi, via milano 1, 22222, milano
    444222222, 111111, 1010, giuseppe@mail.it
    franco, bianchi, via genova 3, , genova
    555666666, 222222, , franco@mail.it

    ovvero nome, cognome, via, cap e città per le righe dispari e cellulare, telefono, fax, email per le righe pari. Ho previsto ovviamente che alcuni campi possano non contenere dati.

    Come accennato prima ho usato la powershell per risolvere il problema
    E' scaricabile a questo indirizzo

    http://www.microsoft.com/windowsserv.../download.mspx

    Prima di installarla accertarsi di avere già il framework .NET 2.0

    http://www.microsoft.com/downloads/d...d-aab15c5e04f5

    In caso contrario installarlo.
    Fatto tutto ciò digitare powershell da esegui. Se si apre la shell l'installazione è andata a buon fine.
    Come ultima cosa scaricare powershell analyzer, un'utilissima interfaccia grafica standalone della shell, a questo indirizzo

    http://shelltools.wik.is/PowerShell_Analyzer


    Infine lo script che basterà incollare nell'editor di powershell analyzer (premere poi il triangolino verde per eseguire il comando)
    Le uniche righe da modificare sono il percorso del file di testo di partenza e la destinazione in cui si vuole salvare il csv risultante.

    codice:
    $righe = get-Content "C:\path_completo\rubrica.txt"
    $i = 0
    $list = @()
    foreach ($riga in $righe) {
        if ($i % 2 -eq 0) {
            $split = $riga.Split(",")
            $nome = $split[0].trim()
            $cognome = $split[1].trim()
            $via = $split[2].trim()
            $cap = $split[3].trim()
            $citta =  $split[4].trim()
        }
        else {
            $split = $riga.Split(",")
            $cellulare = $split[0].trim()
            $telefono = $split[1].trim()
            $fax = $split[2].trim()
            $mail = $split[3].trim()
    
            $object = new-Object psobject
            $object | add-member noteproperty -name nome -value $nome
            $object | add-member noteproperty -name cognome -value $cognome
            $object | add-member noteproperty -name via -value $via
            $object | add-member noteproperty -name cap -value $cap
            $object | add-member noteproperty -name citta -value $citta
    
            $object | add-member noteproperty -name cellulare -value $cellulare
            $object | add-member noteproperty -name telefono -value $telefono
            $object | add-member noteproperty -name fax -value $fax
            $object | add-member noteproperty -name mail -value $mail
    
            $list+= $object
            }
    $i++
    }
    $list  | export-Csv -notypeinformation -encoding "Unicode" c:\rubrica.csv

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.