Visualizzazione dei risultati da 1 a 6 su 6
  1. #1

    estrarre contenuto di file office

    Buongiorno,

    mi trovo a dover estrarre il contenuto dei file office (direi principalmente file word e magari ppt).

    Ho cercato on-line diverse soluzioni, tra cui POI di apache.

    Il problema è che il progetto POI non supporta ancora pienamente la lettura di file word (c'è scritto che sono supportati il formato word 97-2000).

    Infatti, provando quelel classi effettua una buona lettura anche del formato 2003, mentre non estrae per niente il formato 2007 (.docs).

    Per riassumere, sto cercando, anche A PAGAMENTO, una libreria in grado di estrarre il contenuto dei seguenti file:
    .doc
    .docs
    .rtf

    Eventualmente anche .ppt

    Grazie mille per la collaborazione.

  2. #2
    Ciao,
    non ho soluzioni pronte da proporti,
    ma forse con l'ultima release di office,
    microsoft si è avvicinato al formato openXML.

    Qui puoi trovare delle informazioni:
    1) http://www.openxml.org/
    2) http://technet.microsoft.com/it-it/l.../ms186918.aspx

    e qui forse il prodotto che cerchi: http://www.google.it/pagead/iclk?sa=...Dofficeopenxml

    Ciao
    Mirko Agrati
    WEB : http://mirkoagrati.110mb.com
    RSS : http://feeds.feedburner.com/MirkoAgratiArticoli

  3. #3
    sorry, credo di essermi spiegato male.

    Ho bisogno di librerie java che effettuano l'estrazione del contenuto da quei tipi di file.

    Ciao!

  4. #4
    Utente di HTML.it
    Registrato dal
    Aug 2002
    Messaggi
    8,013
    Non so se esistando librerie già pronte, però il consiglio di mirko ti mette sulla giusta pista:

    http://www.infoq.com/articles/cracki...2007-with-java

    al di là del titolo roboante (non è nessun cracking di niente), l'articolo spiega bene come trattare un file in formato Word 2007: si scompatta e si tratta come un file XML.

    non aveno Office 2007 (e nemmeno documenti di Word 2007), non posso provare il codice...
    <´¯)(¯`¤._)(¯`»ANDREA«´¯)(_.¤´¯)(¯`>
    "The answer to your question is: welcome to tomorrow"

  5. #5
    Grazie mille!!

    Sembra veramente più facile del previsto leggere i docx!

    Ciao

  6. #6
    Utente di HTML.it
    Registrato dal
    Aug 2002
    Messaggi
    8,013
    Ogni tanto anche alla microsoft fanno le cose per bene
    <´¯)(¯`¤._)(¯`»ANDREA«´¯)(_.¤´¯)(¯`>
    "The answer to your question is: welcome to tomorrow"

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.