Se vuoi farlo da C++ dovresti usare una qualche libreria di parsing HTML, vedi qui per qualche link.
Amaro C++, il gusto pieno dell'undefined behavior.
Regole del Forum