Visualizzazione dei risultati da 1 a 1 su 1

Discussione: Semplice scraper php

  1. #1

    Semplice scraper php

    Buongiorno, sto provando a creare uno scraper che dal sitemap di un sito, sfogli tutti gli indirizzi ed estragga nome di un prodotto e prezzo.
    Riesco facilmente ad estrarre gli indirizzi dall'indirizzo del sitemap grazie ad un ciclo foreach :
    Codice PHP:
    $xml simplexml_load_file("https://www.miosito.it/sitemap.xml");
    if(
    $xml)
    {
        echo 
    "ho aperto l'url xml correttamente "//DA ELIMINARE ED INSERIRE TUTTI I FOR EACH
    }

        foreach(
    $xml as $cd){
            foreach (
    $cd->loc as $link){
               echo 
    $link."<br>";

    ... 
    l problema lo riscontro quando devo sfogliare questi link per estrarre solo 2 elelementi della pagina un h1 con itemprop="name" e lo span con itemprop="price" ovviamente entrambi hanno anche classi ed id che cambiano di pagina in pagina perchè includono gli id articoli; pertanto essendo itemprop la chiave comune penso che sia la cosa giusta da fare usare questo attribbuto come chiave.
    Ovviamente il sitemap contiene anche le pagine di errore e pagine che non hanno articoli all'interno (come chisiamo.php per esempio) che ovviamente potrei skippare con un semplice controllo if/else.
    Non riesco a trovare una guida semplice. Potete aiutarmi?
    Grazie mille!
    Ultima modifica di asudemazze; 04-02-2020 a 13:03

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2020 vBulletin Solutions, Inc. All rights reserved.