Salve a tutti,
Vorrei poter aprire una pagina web esterna (che può essere una qualunque pagina) e ottenerne i contenuti come HTML, possibilmente parsandolo in modo da poter analizzare e ottenere alcune proprietà precise (titolo, links, immagini presenti, meta tags, testo semplice).
Ho provato con file_get_contents() ma non funziona sempre. Per alcune pagine funziona, per altre no.
Idee?