Visualizzazione dei risultati da 1 a 4 su 4

Discussione: Parser pagina html

  1. #1

    Parser pagina html

    Salve,

    non so come fare la seguente cosa: prendere un url e parsarlo per ricavare alcune informazioni al suo interno

    non so quindi se salvare la pagina html in locale (e non so come si fa) e poi aprila come file di testo e parsarla

    oppure se c'è un modo di parsarla direttamente senza scaricarla...

    spero in un vostro aiuto

    Daniele

  2. #2
    Utente di HTML.it
    Registrato dal
    Aug 2002
    Messaggi
    8,013
    Direttamente dal sito di php

    codice:
    <?php
    // For PHP 5 and up
    $handle = fopen("http://www.example.com/", "rb");
    $contents = stream_get_contents($handle);
    fclose($handle);
    ?>
    
    <?php
    $handle = fopen("http://www.example.com/", "rb");
    $contents = '';
    while (!feof($handle)) {
      $contents .= fread($handle, 8192);
    }
    fclose($handle);
    ?>
    in $contents alla fine avrai l'intero contenuto del file remoto. Dopo dovresti dirci di più sulle operazioni che vuoi fare... magari te ne esci con una qualche regex, oppure potresti andare a cercare qualche classe/funzione che aiuti a manipolare un sorgente (X)HTML
    <´¯)(¯`¤._)(¯`»ANDREA«´¯)(_.¤´¯)(¯`>
    "The answer to your question is: welcome to tomorrow"

  3. #3
    innanzitutto grazie
    era quello che volevo sapere

    si ora io quello che devo fare è parsare pagine web tutte uguali (in termini di estetica e formattazione) e devo prendere alcune informazioni, dei dati
    per esempio, una tabella con nome, cognome, città (che variano da pagina a pagina)
    devo estrarre questi dati dalla pagina...

    pensavo tipo di cercare attraverso i tag dei css (sapendo a priori come si chiamano) o le intestazioni delle tabelle...

  4. #4
    Originariamente inviato da Andrea1979
    Direttamente dal sito di php

    codice:
    <?php
    // For PHP 5 and up
    $handle = fopen("http://www.example.com/", "rb");
    $contents = stream_get_contents($handle);
    fclose($handle);
    ?>
    
    <?php
    $handle = fopen("http://www.example.com/", "rb");
    $contents = '';
    while (!feof($handle)) {
      $contents .= fread($handle, 8192);
    }
    fclose($handle);
    ?>
    in $contents alla fine avrai l'intero contenuto del file remoto. Dopo dovresti dirci di più sulle operazioni che vuoi fare... magari te ne esci con una qualche regex, oppure potresti andare a cercare qualche classe/funzione che aiuti a manipolare un sorgente (X)HTML
    sto provando a lavorare sul contents però non è che riesco a fare molto...
    se provo a stampare il contents mi stampa una pagina in html ...ma se provo a stampare a 'pezzi' il contents ottengo roba del tipo:

    codice:
    salc vid< >vid/< >"noitceleSegaugnal"=di vid< >"stuCtrohs"=ssalc vid< >vid/< 7002 oilgul 81 ��delocrem >"tidEoThctiws"=di vid< >vid/< >lu/< >il/< >a/"inimir+olop/"=ferh ";eslaf nruter;)ferh.siht(nepo.wodniw"=sserpyekno ";eslaf nruter;)ferh.siht(nepo.wodniw"=kcilcno a< >il< >il/< >a/"annevar+olop/"=ferh ";eslaf nruter;)ferh.siht(nepo.wodniw"=sserpyekno ";eslaf nruter;)ferh.siht(nepo.wodniw"=kcilcno a< >il< >il/< >a/<��lroF>"ilrof+olop/"=ferh ";eslaf nruter;)ferh.siht(nepo.wodniw"=sserpyekno ";eslaf nruter;)ferh.siht(nepo.wodniw"=kcilcno a< >il< >il/< >a/"anesec+olop/"=ferh ";eslaf nruter;)ferh.siht(nepo.wodniw"=sserpyekno ";eslaf nruter;)ferh.siht(nepo.wodniw"=kcilcno a< >il< >il/< >a/"elatrop/"=ferh ";eslaf nruter;)ferh.siht(nepo.wodniw"=sserpyekno ";eslaf nruter;)ferh.siht(nepo.wodniw"=kcilcno a< >il< >il/<>gnorts/<>a/"kniLsupmacitluM_1skniLredaeHsupmacitluM_00ltc_00ltc_00ltc_00ltc"=di a<>gnorts<>il< >lu< >"skniLredaeHsupmacitlum"=di vid< >vid/< >elbat/< >ydobt/< >rt/< >dt/< >vid/<;psbn&>"epirts"=di vid< >vid/<>/ "angoloB id ��tisrevinU - ehcitametaM ezneicS"=tla
    dove non riesco a lavorare...il dovrei lavorare sulla pagina quella che mi stampa contents non su contents...come posso fare?

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.