Visualizzazione dei risultati da 1 a 5 su 5
  1. #1

    Estrarre HTML pagine funzione cURL

    Ciao a tutti,
    Ho la necessità di estrarre il codice html di una pagina web remota tramite PHP. Ho trovato il codice che fa per me e che riporto qui sotto:

    Codice PHP:
    function torna_codice($url)
    {
        
    $curl curl_init();
     
        
    // Setup headers - I used the same headers from Firefox version 2.0.0.6
        // below was split up because php.net said the line was too long. :/
        
    $header[0] = "Accept: text/xml,application/xml,application/xhtml+xml,";
        
    $header[0] .= "text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5";
        
    $header[] = "Cache-Control: max-age=0";
        
    $header[] = "Connection: keep-alive";
        
    $header[] = "Keep-Alive: 300";
        
    $header[] = "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7";
        
    $header[] = "Accept-Language: en-us,en;q=0.5";
        
    $header[] = "Pragma: ";
        
    // browsers keep this blank.
     
        
    $referers = array("google.com""yahoo.com""msn.com""ask.com""live.com");
        
    $choice array_rand($referers);
        
    $referer "http://" $referers[$choice] . "";
     
        
    $browsers = array("Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092510 Ubuntu/8.04 (hardy) Firefox/3.0.3""Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1) Gecko/20060918 Firefox/2.0""Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.3) Gecko/2008092417 Firefox/3.0.3""Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)");
        
    $choice2 array_rand($browsers);
        
    $browser $browsers[$choice2];
     
        
    curl_setopt($curlCURLOPT_URL$url);
        
    curl_setopt($curlCURLOPT_USERAGENT$browser);
        
    curl_setopt($curlCURLOPT_HTTPHEADER$header);
        
    curl_setopt($curlCURLOPT_REFERER$referer);
        
    curl_setopt($curlCURLOPT_AUTOREFERERtrue);
        
    curl_setopt($curlCURLOPT_RETURNTRANSFERtrue);
        
    curl_setopt($curlCURLOPT_TIMEOUT30);
        
    curl_setopt($curlCURLOPT_MAXREDIRS7);
        
    curl_setopt($curlCURLOPT_FOLLOWLOCATIONtrue);
     
        
    $data curl_exec($curl);
     
        if (
    $data === false) {
            
    $data curl_error($curl);
        }
     
        
    // execute the curl command
        
    curl_close($curl);
        
    // close the connection
     
        
    return $data;
        
    // and finally, return $html

    Il mio problema è che non posso memorizzare tutto dentro una variabile xD Come posso fare senza salvarlo su file? Questo mi serve perchè devo estrarre un link particolare che cambia ogni volta e che è contenuto nel codice HTML.

  2. #2
    Utente di HTML.it L'avatar di neroux
    Registrato dal
    Aug 2009
    Messaggi
    1,973
    file_get_contents() non lo puoi usare?

    www.sitemeer.com » Quando un sito pare irraggiungibile

    Se ti piace ci puoi trovare anche su Facebook

  3. #3
    mmm che funzione è? ora cerco qualcosa al riguardo. hai esempi?

  4. #4
    Utente di HTML.it L'avatar di neroux
    Registrato dal
    Aug 2009
    Messaggi
    1,973

    www.sitemeer.com » Quando un sito pare irraggiungibile

    Se ti piace ci puoi trovare anche su Facebook

  5. #5
    ok. piccolo OT:

    come faccio a limitare la funzione strpos: cioè io voglio che dopo tot caratteri dopo la prima stringa si fermi (senza usare la substr che mi impone id mettere il numero di caratteri da cui iniziare e che sono variabili da una seria di fattori)

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.