Visualizzazione dei risultati da 1 a 6 su 6
  1. #1

    Leggere contenuto di un sito

    Salve a tutti, si può tramite php, dando in input l'url di un sito, prendere la lista dei file al suo interno? Tipo come fa google quando gli dai l'url per fare la sitemap!
    Andrea

    if($browser == 'internet explorer'){
    $bestemmie++;
    }

  2. #2
    Moderatore di PHP L'avatar di Alhazred
    Registrato dal
    Oct 2003
    Messaggi
    12,474
    Non ho capito, Tu vuoi dare l'indirizzo della home page di un sito e ricavare tutte le pagine che compongono quel sito?

    Google per fare la mappa penso faccia una cosa di questo tipo (ma potrei sbagliare):
    1) legge la pagina passata alla funzione ed estrapola i link che puntano a pagine dello stesso dominio
    2) per ogni pagina trovata ripete l'estrapolazione dei link

    per ricavare i link dal contenuto della pagina puoi usare delle espressioni regolari e preg_match_all().

  3. #3
    Ho pensato anch'io la stessa cosa...peccato perchè con i siti col menu in flash va tutto a remengo :P
    Andrea

    if($browser == 'internet explorer'){
    $bestemmie++;
    }

  4. #4
    Moderatore di PHP L'avatar di Alhazred
    Registrato dal
    Oct 2003
    Messaggi
    12,474
    Lo so, infatti i siti flash per l'indicizzazione sono un po' un casino.
    Gli spider dei motori di ricerca li ignorano, indicizzano solo la home, Google da un po' di tempo ha messo a punto uno spider che riesce ad estrapolare i link dai file swf, ma indicizza solo i link, il contenuto, anche se testuale viene ignorato.

  5. #5
    Grazie per le risposte celeri!! Buone feste!
    Andrea

    if($browser == 'internet explorer'){
    $bestemmie++;
    }

  6. #6
    Moderatore di PHP L'avatar di Alhazred
    Registrato dal
    Oct 2003
    Messaggi
    12,474
    Grazie, buone feste anche a te

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.