Visualizzazione dei risultati da 1 a 5 su 5
  1. #1

    [PHP] Non esegue il parsing su un dato sito e negli altri si...

    Salve,
    mi si verifica una cosa insolita, sto facendo il parsing di una pagina online tramite questo script:


    Codice PHP:
    require_once 'simple_html_dom.php';
    $html file_get_html('https://www.olx.ro');
    foreach(
    $html->find('div') as $element)        echo $element->innertext  '<br>'
    Mi restituisce questo errore:

    codice:
    Il nostro sistema ha rilevato un problemaL'indirizzo IP che si utilizza sembra essere associato a una fonte di traffico a traffico limitato.
    Č anche una buona idea per una passeggiata di 10 minuti. Č un problema persistente, contact-nos:
    Providencia no formulįrio a seguinte referenźncia
    OLX: 18.85b3f748.1533721154.4400f950
    Se invece di "olx.ro" inserisco "subito.it" oppure "paginegialle.it" o altri, funzionano!!

    Cosa ha OLX che impedisce di fare il parsing??

    Grazie molte.
    Ultima modifica di w_t; 08-08-2018 a 11:52

  2. #2
    Moderatore di PHP L'avatar di Alhazred
    Registrato dal
    Oct 2003
    Messaggi
    12,445
    Probabilmente non consentono accessi con funzioni che richiedono il codice della pagina, tipo file_get_html (nel tuo caso) o anche con file_get_contents (fa una prova) e simili.
    Se anche file_get_contents da lo stesso problema, prova a vedere se con cURL puoi ottenere il codice della pagina.

  3. #3
    Provato, neppure con cURL!!!
    Quindi non ci sono altri escamotage?
    Neppure in altri linguaggi?

  4. #4
    Cosa ha in pił un browser di un cUrl che si presenta come Mozzilla ???

  5. #5
    Utente di HTML.it L'avatar di clasku
    Registrato dal
    Aug 2006
    Messaggi
    3,197
    Uno userAgent...

Tag per questa discussione

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.