siamo un po' al punto di partenza:
ti accontenti di ripulire il codice o vuoi/puoi far di meglio?
se vuoi solo ripulire passa il file html ad uno script che faccia il replace delle cose inutili.
la noia sta nello stabilire di cosa fare il replace. salvo eccezioni una volta impostato fa quasi tutto.