PDA

Visualizza la versione completa : Modifica testo con file .bat


pippo1000000
04-12-2013, 14:44
Salve a tutti. Avevo intenzione di crearmi un piccolo programmino che dato un file .html elimini il contenuto dei tag.
Tanto per fare un esempio se nel file c' un

<title>CIAO</title>
il programma deve eliminare il ciao, e se ci sono tag uno all'interno dell'altro non deve eliminarli.
Mi rendo conto che sia abbastanza complesso e se non possibile farlo in dos mi chiedo se possibile in C.
In ogni caso il risultato dovrebbe essere un file html con dentro tutti i tag di prima, solo svuotati.
E' possibile o mi sono inventato un problema pi grande di me?:dh::dh:

MItaly
05-12-2013, 16:50
Dubito che si riesca a fare in maniera decente in Batch, quello che ti serve un linguaggio di scripting "vero" dotato di un parser HTML: una volta ottenuto l'albero DOM del documento, lo puoi manipolare come ti pare e poi riscrivere su disco.

Personalmente userei Python con BeautifulSoup (che supporta bene (http://www.crummy.com/software/BeautifulSoup/bs4/doc/#modifying-the-tree) questo genere di cose), ma ci sono diverse alternative per altri linguaggi.

Loading