Visualizzazione dei risultati da 1 a 7 su 7
  1. #1

    Webbot e spider con php

    salve sto valutando la possibilità di sviluppare (per studio) uno spider/webbot con php.
    la cosa è possibile ? (o trovato anche un testo che sembra essere interessante)
    esistono dei "tutorial" in grado di spiegare i rudimenti ?

  2. #2
    Da farlo interno, puoi anche usare la ricerca di directory, e per i vari meta tag come robots e keyword, esiste questa funzione: http://it.php.net/manual/it/function.get-meta-tags.php

  3. #3
    è semplicissimo farlo.

    basta sapere usare regex e socket

  4. #4
    per farlo su siti esterni ?
    avrei una quindicina di siti da monitorare è troppo ?
    bisogna lavorare specificatamente su ciascun sito ?

  5. #5
    no secondo te il bot di google è "tarato" per ciascuno dei milioni di siti esistenti?


    ti ho detto bastano regex e socket.

  6. #6
    Utente di HTML.it L'avatar di dottwatson
    Registrato dal
    Feb 2007
    Messaggi
    3,012
    la cosa interessa anche me ed è da un paio di giorni che cerco di documentarmi.

    in primis mi interesserebbe far riconoscere al sito che contatto che io sono uno spider, quindi sapere se e come deve essere impostato un eventuale header nelle richieste tramite socket
    Non sempre essere l'ultimo è un male... almeno non devi guardarti le spalle

    il mio profilo su PHPClasses e il mio blog laboweb

  7. #7
    Originariamente inviato da dottwatson
    la cosa interessa anche me ed è da un paio di giorni che cerco di documentarmi.

    in primis mi interesserebbe far riconoscere al sito che contatto che io sono uno spider, quindi sapere se e come deve essere impostato un eventuale header nelle richieste tramite socket
    tutto ciò che hai bisogno è: http://docs.php.net/manual/it/

    e in particolare:

    http://docs.php.net/manual/it/ref.sockets.php

    hai tutto li

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.