Visualizzazione dei risultati da 1 a 7 su 7
  1. #1

    [java]Rimuovere alcuni tag html

    Come posso fare per rimuovere i tag <script></script> e e tutto il loro contenuto?

  2. #2
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284

    Re: [java]Rimuovere alcuni tag html

    Originariamente inviato da lordkarolus
    Come posso fare per rimuovere i tag <script></script> e e tutto il loro contenuto?
    Rimuovere dove?? In una stringa? In un file?
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  3. #3
    io leggo un file da un qualsiasi sito e poi lo scanno riga per riga

  4. #4
    Moderatore di Programmazione L'avatar di LeleFT
    Registrato dal
    Jun 2003
    Messaggi
    17,320
    Originariamente inviato da lordkarolus
    io leggo un file da un qualsiasi sito e poi lo scanno riga per riga
    Lo scanni? Col coltello?

    Tornando seri, hai due possibilità:

    1) Salvi il file prodotto e lo dai in pasto ad una libreria per il trattamento dei documenti ad albero (come JDom, che tratta i file XML... da notare che un file HTML è anche un file XML). In questo modo puoi indicizzare tutti gli elementi che ti interessano e rimuoverli tramite le API messe a disposizione dalla libreria

    2) Il lavoro lo fai a mano: man mano che leggi tieni traccia dell'elemento letto e se incontri il tag che ti interessa, ignori tutto il contenuto successivo fino al raggiungimento del relativo tag di chiusura.

    In altre parole: non è un'operazione semplice, e le RegEx possono aiutare (o complicare, a seconda dei casi).


    Ciao.
    "Perchè spendere anche solo 5 dollari per un S.O., quando posso averne uno gratis e spendere quei 5 dollari per 5 bottiglie di birra?" [Jon "maddog" Hall]
    Fatti non foste a viver come bruti, ma per seguir virtute e canoscenza

  5. #5
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284
    Originariamente inviato da lordkarolus
    io leggo un file da un qualsiasi sito e poi lo scanno riga per riga
    Se avessi tutto il contenuto del file in una unica String, sarebbe ancora semplice: si potrebbe usare una espressione regolare e in una botta sola si possono eliminare le parti che corrispondono alla espressione regolare.

    Fatto riga per riga è solo un po' più complicato. Se ci pensi un attimo, il tag di chiusura potresti trovarlo sulla stessa riga del tag di apertura ma potresti anche trovarlo molte righe dopo.
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

  6. #6
    non è che mi accenneresti una bozza di regex che io non ci vado molto d'accordo?

  7. #7
    Utente di HTML.it L'avatar di andbin
    Registrato dal
    Jan 2006
    residenza
    Italy
    Messaggi
    18,284
    Originariamente inviato da lordkarolus
    non è che mi accenneresti una bozza di regex che io non ci vado molto d'accordo?
    Prova questo esempio, vedi cosa stampa in output.

    codice:
    String str = "Ciao prova di un codice html";
    
    String str2 = str.replaceAll (".*?", "");
    
    System.out.println (str2);
    Andrea, andbin.devSenior Java developerSCJP 5 (91%) • SCWCD 5 (94%)
    java.util.function Interfaces Cheat SheetJava Versions Cheat Sheet

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.