salve sto valutando la possibilità di sviluppare (per studio) uno spider/webbot con php.
la cosa è possibile ? (o trovato anche un testo che sembra essere interessante)
esistono dei "tutorial" in grado di spiegare i rudimenti ?
salve sto valutando la possibilità di sviluppare (per studio) uno spider/webbot con php.
la cosa è possibile ? (o trovato anche un testo che sembra essere interessante)
esistono dei "tutorial" in grado di spiegare i rudimenti ?
Da farlo interno, puoi anche usare la ricerca di directory, e per i vari meta tag come robots e keyword, esiste questa funzione: http://it.php.net/manual/it/function.get-meta-tags.php
è semplicissimo farlo.
basta sapere usare regex e socket![]()
per farlo su siti esterni ?
avrei una quindicina di siti da monitorare è troppo ?
bisogna lavorare specificatamente su ciascun sito ?
no secondo te il bot di google è "tarato" per ciascuno dei milioni di siti esistenti?![]()
ti ho detto bastano regex e socket.
la cosa interessa anche me ed è da un paio di giorni che cerco di documentarmi.
in primis mi interesserebbe far riconoscere al sito che contatto che io sono uno spider, quindi sapere se e come deve essere impostato un eventuale header nelle richieste tramite socket
Non sempre essere l'ultimo è un male... almeno non devi guardarti le spalle
il mio profilo su PHPClasses e il mio blog laboweb
tutto ciò che hai bisogno è: http://docs.php.net/manual/it/Originariamente inviato da dottwatson
la cosa interessa anche me ed è da un paio di giorni che cerco di documentarmi.
in primis mi interesserebbe far riconoscere al sito che contatto che io sono uno spider, quindi sapere se e come deve essere impostato un eventuale header nelle richieste tramite socket
e in particolare:
http://docs.php.net/manual/it/ref.sockets.php
hai tutto li