Visualizzazione dei risultati da 1 a 5 su 5
  1. #1
    Utente di HTML.it
    Registrato dal
    Apr 2008
    Messaggi
    36

    Estrarre testo html da file xml

    Salve a tutti...premetto che conosco molto poco di xml...la mia situazione è questa...
    ho un file xml contenente vari campi che dovrei leggere e rimettere i dati su database...tramite il DomParser sono riuscito ad estrarre i vari campi ma sorge un problema quando uno di questi campi contiene un testo html...perchè il parser mi legge i vari tag html come sottonodi del nodo in cui mi trovo...io ho a disposizione il dtd del file xml e penso che questo mi possa aiutare...ma non ho la minima idea di come usarlo...qualcuno può aiutarmi???

  2. #2
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284

    Re: Estrarre testo html da file xml

    Originariamente inviato da rascio88
    Salve a tutti...premetto che conosco molto poco di xml...la mia situazione è questa...
    ho un file xml contenente vari campi che dovrei leggere e rimettere i dati su database...tramite il DomParser sono riuscito ad estrarre i vari campi ma sorge un problema quando uno di questi campi contiene un testo html...perchè il parser mi legge i vari tag html come sottonodi del nodo in cui mi trovo...io ho a disposizione il dtd del file xml e penso che questo mi possa aiutare...ma non ho la minima idea di come usarlo...qualcuno può aiutarmi???
    Innanzitutto dovresti specificare quale libreria/parser stai usando. Visto che parli di "DomParser", posso immaginare che stai usando direttamente Xerces. È solo una delle possibilità ... si potrebbero sfruttare altri parser o anche attaverso la API JAXP.

    A parte questo, se usi l'approccio DOM, alla fine di tutta la procedura di parsing ottieni un albero di nodi e spetta a te, secondo cosa devi fare, "navigare" avanti e indietro nell'albero per reperire le informazioni che ti servono.

    Ma a questo punto bisognerebbe vedere meglio come è la struttura del documento XML, cioè dove sono le parti HTML, se ai tag HTML è stato associato un namespace e cosa devi estrarre.
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  3. #3
    Utente di HTML.it
    Registrato dal
    Apr 2008
    Messaggi
    36
    si le librerie sono quelle di xerces ma non devo usare per forza quelle...come già detto ho le idee molto confse sul come farlo...l'xml è una cosa tipo:
    codice:
    <record>
    <nome>pippo</nome>
    <categoria>fumetto</categoria>
    <descrizione> pippo è un amico di Topolino</descirizione>
    </record>
    io devo estrarre quei dati...quello che ho trovato su internet è stata quella libreria Xerces e visto che ero riuscito cmq a ricavare tutto pensavo che andava bene quella...però se c'è qlc soluzione migliore buono a sapersi...

  4. #4
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284
    Originariamente inviato da rascio88
    codice:
    <record>
    <nome>pippo</nome>
    <categoria>fumetto</categoria>
    <descrizione> pippo è un amico di Topolino</descirizione>
    </record>
    Ok ma dipende da cosa devi farci. Il nodo <descrizione> nel caso sopra avrà 3 nodi figli: un nodo di testo " pippo è un " poi un elemento [b] e infine un nodo di testo " di Topolino". Il nodo dell'elemento [b] avrà un unico figlio che è un nodo di testo "amico".
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  5. #5
    Utente di HTML.it
    Registrato dal
    Apr 2008
    Messaggi
    36
    si ok e così è proprio come viene a me...il problema è che il nodo di testo descrizione mi dovrebbe contenere proprio
    codice:
    pippo è un amico  di topolino
    il prob è come faccio a dirgli che descrizione non può avere un nodo figlio e che quindi mi deve prendere tutto quello che ha dentro???

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.