Questo è un caso da espressione regolare.
Ad esempio, se prendi il tuo $str=file_get_contents($file); e poi fai
Codice PHP:
preg_match_all('/<a\s.*?href="(?:http:\/\/|https:\/\/)?([url]www.*?[/url])"/i',$str,$matches);
ti trovi in $matches[1] un array del tipo
Codice PHP:
[1] => Array
(
[0] => "www.pubblicaamministrazione.net"
[1] => "www.digital.it"
[2] => "www.gamesnation.it"
[3] => "www.facebook.com/HTML.it"
[4] => "www.freehtml.it"
[5] => "www.newsletter.it"
[6] => "www.oneblog.it"
[7] => "www.oneadsl.it"
[8] => "www.oneapple.it"
[9] => "www.oneauto.it"
[10] => "www.onecalcio.it"
[11] => "www.onecinema.it"
[12] => "www.onedigital.it"
[13] => "www.onegames.it"
[14] => "www.onegreentech.it"
[15] => "www.onehardware.it"
[16] => "www.onehome.it"
[17] => "www.oneitoffice.it"
[18] => "www.oneitsecurity.it"
[19] => "www.oneluxury.it"
[20] => "www.onemobile.it"
[21] => "www.oneopensource.it"
[22] => "www.onetivu.it"
[23] => "www.oneweb20.it"
[24] => "www.onewindows.it"
[25] => "www.onewoman.it"
[26] => "www.aaaaaa.dd"
[27] => "www.gruppohtml.it/"
[28] => "www.tagadvertising.it/Default.aspx"
[29] => "www.html.it/info/job.php"
[30] => "www.html.it/info/contatti.php"
[31] => "www.html.it/info/note-legali.php"
)
Questo l'ho ottenuto testando la regexp sulla pagina contenente il tuo post.
Ciao