Sto usando CURL e Simple HTML DOM Parser per estrarre i contenuti da una pagina web esterna. Nello specifico, li sto usando per estrarre il link di tutte le immagini dalle pagine dei prodotti di questo sito.
Funziona con la maggior parte delle pagine, questa ad esempio https://www.geekbuying.com/item/eufy...er-520574.html
Con altre, la cui struttura è di fatto identica, non riesce ad estrarre niente, questa ad esempio https://www.geekbuying.com/item/eufy...er-520591.html
Codice PHP:
include "simple_html_dom.php";
$link = "https://www.geekbuying.com/item/eufy-Clean-G40-Hybrid--Robot-Vacuum-Cleaner-520591.html"; //don't works
$link = "https://www.geekbuying.com/item/eufy-MACH-V1-Cordless-Vacuum-Cleaner-520574.html"; //works
function get_content($url)
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$htmlContent = curl_exec($ch);
curl_close($ch);
$dom = new simple_html_dom();
$dom->load($htmlContent);
foreach($dom->find('img') as $element){
$immagine = $element->src;
echo "$immagine <br />";
}
}
get_content($link);
Qualcuno ne conosce il motivo?