avendo una pag html devo estrarre tutti gli href e memorizzarli in un file xml.

ad esempio una pagina con presnte un link: <a href="http://www.miosito.it">mio sito<a/> dovrò estrarre: "http://www.miosito.it"