Visualizzazione dei risultati da 1 a 5 su 5

Discussione: Decodifica codice html

  1. #1
    Utente di HTML.it
    Registrato dal
    Sep 2007
    Messaggi
    102

    Decodifica codice html

    Ciao sto facendo una piccola applicazione per il parsing di una pagina web

    Per quanto riguarda i codici html
    codice:
    & # x 2 7 ;
    & # x E 9 ;
    & e g r a v e ;
    .....
    esiste una classe standard di java che li decodifichi?

    Grazie ciao

  2. #2
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284

    Re: Decodifica codice html

    Originariamente inviato da Pegasys
    esiste una classe standard di java che li decodifichi?
    Un metodo apposito e specifico per questo no, non c'è nel framework standard di Java SE.
    Se cerchi in rete trovi sicuramente librerie piccole o grandi che hanno metodi di utilità di questo tipo. E comunque se anche decidessi di decodificarle tu, non sarebbe particolarmente difficile. Basta "riconoscere" l'inizio & e la fine ; poi per le entità con nome basta una semplice "map" di nomi->codici e per entità numeriche basta parsare il valore con il solito parseInt di Integer.
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  3. #3
    Utente di HTML.it
    Registrato dal
    Sep 2007
    Messaggi
    102
    Se decidessi di fare una lista, hai una lista.... di tutte le combinazioni?

  4. #4
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284
    Originariamente inviato da Pegasys
    Se decidessi di fare una lista, hai una lista.... di tutte le combinazioni?
    Le trovi dappertutto. Poi comunque bisogna vedere quali vuoi supportare. Solo le 5 standard di XML? Quelle di HTML 2 o anche 3.2 o anche 4?

    Comunque: http://en.wikipedia.org/wiki/List_of...ity_references
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  5. #5
    Utente di HTML.it
    Registrato dal
    Sep 2007
    Messaggi
    102
    Le utilizzo su un sito dove c'è solo testo, quindi lettere accentate, apostrofi e basta per lo più.


    '
    é
    è

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.