Leggere una pagina HTML esterna non è un problema...isolare un 'contenuto' e riproporlo in un'altra formattazione mi pare una cosa impensabile...
Se hai mai provato ad aprire il sorgente HTML di una pagina ti sarai reso conto della miriade di tag nidificati + javascript + altre amenità!!!
Tanto vale fornire il link alla pagina o aprirlo in un frame...