Visualizzazione dei risultati da 1 a 6 su 6
  1. #1
    Utente di HTML.it
    Registrato dal
    Feb 2011
    Messaggi
    2

    problema nel parsing di una pagina web

    salve ragazzi! sto facendo il parsing di una pagina web. utilizzo java e la libreria java cleaner per ripulire il codice. la pagina web in questione è questa: http://www.symmetricom.com/resources...ions-glossary/ ora io ho bisogno sia dei nomi che delle definizioni. i nomi sono all'interno del tag strong mentre non riesco a capire come fare a prendere le definizioni!
    mi date una mano!
    per prendere i nomi faccio cosi:
    TagNode Elements[] = rootNode.getElementsByName("strong", true);
    for (int i = 0; i < Elements.length; i++) {

    lista.add(Elements[i].getText().toString().toLowerCase());

    }

  2. #2
    Moderatore di Programmazione L'avatar di alka
    Registrato dal
    Oct 2001
    residenza
    Reggio Emilia
    Messaggi
    24,472

    Moderazione

    Ciao e benvenuto nel forum di Programmazione.

    Ti segnalo da subito la lettura del nostro Regolamento che contiene tutte le norme da seguire per partecipare correttamente a quest'area del forum.

    Ho spostato la discussione nel forum dedicato a Java.
    In futuro, poni qui le tue domande relative a questo linguaggio.

    Detto questo, ciao e...buon forum!
    MARCO BREVEGLIERI
    Software and Web Developer, Teacher and Consultant

    Home | Blog | Delphi Podcast | Twitch | Altro...

  3. #3
    Utente di HTML.it L'avatar di bstefano79
    Registrato dal
    Feb 2004
    Messaggi
    2,520
    prova così

    TagNode Elements[] = rootNode.getElementsByName("td", true).getText();

  4. #4
    Utente di HTML.it
    Registrato dal
    Feb 2011
    Messaggi
    2
    grazie per le risposte. avevo già provato con td ma il problema è che mi restituisce cose che non servono. ed è molto difficile rimuoverle!

  5. #5
    Utente di HTML.it L'avatar di bstefano79
    Registrato dal
    Feb 2004
    Messaggi
    2,520
    anche con il getText() ???

  6. #6
    Io ti consiglio di usare le regular expression (gli oggetti Pattern e Matcher), con cui parsi le pagine moolto + velocemente (senza metterti a parsare tutti i child tag con DOM), ovviamente se il loro codice rispetta una certa forma.
    lolide
    Java Programmer

    Informati

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.