Estrarre immagini da pagina esterna con CURL e PHP Simple HTML DOM Parser

**!!\Freedom9/!!** · 30-05-2023, 18:01

Sto usando CURL e Simple HTML DOM Parser per estrarre i contenuti da una pagina web esterna. Nello specifico, li sto usando per estrarre il link di tutte le immagini dalle pagine dei prodotti di questo sito.
Funziona con la maggior parte delle pagine, questa ad esempio https://www.geekbuying.com/item/eufy...er-520574.html

Con altre, la cui struttura è di fatto identica, non riesce ad estrarre niente, questa ad esempio https://www.geekbuying.com/item/eufy...er-520591.html

Codice PHP:


include "simple_html_dom.php";
$link = "https://www.geekbuying.com/item/eufy-Clean-G40-Hybrid--Robot-Vacuum-Cleaner-520591.html"; //don't works

$link = "https://www.geekbuying.com/item/eufy-MACH-V1-Cordless-Vacuum-Cleaner-520574.html"; //works


function get_content($url)
{
    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    $htmlContent = curl_exec($ch);
    curl_close($ch);
    $dom = new simple_html_dom();
    $dom->load($htmlContent);
    foreach($dom->find('img') as $element){
        $immagine = $element->src;
        echo "$immagine <br />";
    }
}

get_content($link);

Qualcuno ne conosce il motivo?

**darbula** · 30-05-2023, 22:35

Perché non stai ottenendo la risposta http 200 ma 301Moved Permanently.

Discussione: Estrarre immagini da pagina esterna con CURL e PHP Simple HTML DOM Parser

Strumenti discussione

Ricerca discussione

Visualizza

Estrarre immagini da pagina esterna con CURL e PHP Simple HTML DOM Parser

Permessi di invio