Vorrei realizzare uno script che analizzi un documento in html, in modo da poter conoscere il contenuto dei tag e rispettivi attributi.
Per esempio con un documento del tipo
<html>
<body>
<span>Testo</span>
</body>
</html>
vorrei riuscire a leggere il contenuto del tag "<span>". Più o meno come l' XML DOM.
Sapete come fare ? Spero di essere stato abbastanza chiaro