Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 11
  1. #1
    Utente di HTML.it
    Registrato dal
    Aug 2009
    Messaggi
    8

    Estrazione titoli di tag all'interno di codice html

    Ciao a tutti..

    vi espongo il mio problema:
    sto facendo un applicazione client-server con java..

    1) devo fare in modo di collegarmi ad un sito e togliere il codice html di quella pagina, e fino a qua ci siamo.

    2) il problema sorge quando una volta ottenuto il codice html devo estrarre delle domande che sono contenute all'interno di tag..
    il codice che rappresenta una delle tantissime domande è il seguente:

    --------------------------------------------------------------------------------

    <form action='' method='post' name='submit'><table id=quiz>
    <tr bgcolor=#666666>
    <td colspan=3 border=1 scope=col align=center >Domanda n. 14</td>
    </tr>
    <tr bgcolor=#55A0FF>
    <td colspan=3 class=tdquest >Quale tra i seguenti artisti fu pittore e scultore?</td>
    </tr>
    <tr >
    <td width=20><input type=radio id=q368 name=q368 value='1'></td>
    <td width=20>1)</td>
    <td height=30 width=454>Ludovico Carracci</td>
    </tr>
    <tr>
    <td><input type=radio id=q368 name=q368 value='2'></td>
    <td>2)</td>
    <td height=30>Raffaello Sanzio</td>
    </tr>
    <tr>
    <td><input type=radio id=q368 name=q368 value='3'></td>
    <td>3)</td>
    <td height=30>Caravaggio</td>
    </tr>
    <tr>
    <td><input type=radio id=q368 name=q368 value='4'></td>
    <td>4)</td>
    <td height=30>Michelangelo Buonarroti</td>
    </tr></table></br>

    -----------------------------------------------------------------------
    io dovrei togliere queste informazioni:

    - Domanda n.14
    - Quale tra i seguenti artisti fu pittore e scultore?
    - Ludovico Carracci
    - Raffaello Sanzio
    - Caravaggio
    - Michelangelo Buonarroti

    Mi potete spiegare come devo fare??
    Cosa devo usare??

    Vi prego nei dettagli perchè sono alle prime armi..
    Grazie mille!!!
    Ciao..

  2. #2
    Utente di HTML.it L'avatar di ibykos
    Registrato dal
    Feb 2005
    Messaggi
    201
    prova a dare un'occhiata a cosa contiene il vettore

    codice:
    String v[] = html.split("<.*>");
    dove html è il testo html estratto dalla pagina.

  3. #3
    Utente di HTML.it
    Registrato dal
    Aug 2009
    Messaggi
    8
    io vado a fare System.out.println(v);
    e lui mi stampa questo:


    [Ljava.lang.String;@3e205f
    [Ljava.lang.String;@bf73fa
    [Ljava.lang.String;@5740bb
    [Ljava.lang.String;@5ac072
    [Ljava.lang.String;@109a4c
    [Ljava.lang.String;@201f9
    [Ljava.lang.String;@cf8583
    [Ljava.lang.String;@4693c7
    [Ljava.lang.String;@901887
    [Ljava.lang.String;@3a6727
    [Ljava.lang.String;@4a65e0
    [Ljava.lang.String;@665753
    [Ljava.lang.String;@ef22f8
    [Ljava.lang.String;@e0cf70
    [Ljava.lang.String;@52fe85
    [Ljava.lang.String;@c40c80
    [Ljava.lang.String;@10d81b
    [Ljava.lang.String;@dbe178
    [Ljava.lang.String;@af9e22
    [Ljava.lang.String;@b6ece5
    [Ljava.lang.String;@7ace8d
    [Ljava.lang.String;@8eb9e6
    [Ljava.lang.String;@4ed9ff
    [Ljava.lang.String;@ca318a
    [Ljava.lang.String;@7a8913
    [Ljava.lang.String;@bd747e
    [Ljava.lang.String;@2b3374
    [Ljava.lang.String;@3f3789
    [Ljava.lang.String;@571886
    [Ljava.lang.String;@b4199
    [Ljava.lang.String;@ffb8dc
    [Ljava.lang.String;@c184f4
    [Ljava.lang.String;@ffbd68
    [Ljava.lang.String;@ec16a4
    [Ljava.lang.String;@c29ab2
    [Ljava.lang.String;@3a328f
    [Ljava.lang.String;@cd8669
    [Ljava.lang.String;@337838

    sarebbe??

  4. #4
    Utente di HTML.it
    Registrato dal
    Apr 2007
    Messaggi
    157
    è un array, devi usare un ciclo for per stamparlo

  5. #5
    Utente di HTML.it
    Registrato dal
    Aug 2009
    Messaggi
    8
    si ok ma cosa me ne faccio?

    a me servono le parole comprese tra i tag che ho scritto sopra nel primo messaggio..

    Grazie..

  6. #6
    Utente di HTML.it
    Registrato dal
    Apr 2007
    Messaggi
    157
    Originariamente inviato da ibykos

    prova a dare un'occhiata a cosa contiene il vettore

    codice:
    String v[] = html.split("<.*>");
    dove html è il testo html estratto dalla pagina.

  7. #7
    Utente di HTML.it
    Registrato dal
    Aug 2009
    Messaggi
    8
    se faccio questo:

    String [] splitto = risultato.split(">.*<");
    for(int i= 0; i<splitto.length; i++){
    System.out.println(splitto[i]);
    }

    dove risultato è la stringa che contiene tutto il mio codice html.

    ottengo tutto tranne quello che mi serve...

  8. #8
    Utente di HTML.it
    Registrato dal
    Apr 2007
    Messaggi
    157
    intanto puoi estrappolarti tutto il contenuto che c'è tra <form> e </form>. Da lì, tramite regex, puoi ricavarti le righe che ti interessano

  9. #9
    Utente di HTML.it
    Registrato dal
    Aug 2009
    Messaggi
    8
    eh ma io non ho solo il codice ke ho scritto, ma la stringa risultato ha anche molti altri tag all'interno..

    come faccio ad ottenere solo quelle informazioni che mi servono??

  10. #10
    Utente di HTML.it
    Registrato dal
    Apr 2007
    Messaggi
    157
    intando devi filtrare la tabella, dopo di quella estrai ogni singola riga (compresa tra <tr> e </tr>) e ti prendi l'ultimo td (che contiene la risposta)

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.