bhe certo teoricamente hai ragione non fa una grinza

ma un documento xhtml lo puoi analizzare anche con un parser xml
un documento html con
impedisce il parsing