Ciao,
vorrei sapere se esiste qualche risorsa per creare uno spider con php.
![]()
Ciao,
vorrei sapere se esiste qualche risorsa per creare uno spider con php.
![]()
"La grandezza dell'uomo si misura in base a quel che cerca e all'insistenza con cui egli resta alla ricerca".
Vi spiego meglio cosa mi occorre.
Io ho in mente uno strumento che esegue la ricerca e l'indicizzazione di alcuni documenti rispetto ad alcune risorse web predefinite.
La prima cosa alla quale penso è il mondo delle offerte di lavoro.
Ho alcune fonti: jobpXXX, stepXXXX, ecc e su queste il mio spider cerca ogni giorno le nuove offerte, le indicizza (con dei metadati) e le copia in un db.
Spero che qualcuno possa darmi qualche dritta..
![]()
"La grandezza dell'uomo si misura in base a quel che cerca e all'insistenza con cui egli resta alla ricerca".
beh...credo che innanzi tutto devi avere in mente, strutturalmente, cosa devi fare...
quindi...
1° Acquisire la lista di pagine da leggere raggruppate per categoria
2° Ciclare le pagine contenute in ogni categoria
3° Acquisire la pagina HTML
4° Estrarre i dati che interessano
5° Ordinarli tramite appositi algorittimi
6° Inserirli nel database in modo strutturato
7° Tornare al passo 3 fino a quando tutte le pagine di uno specifico gruppo non sono state analizzate
8° Tornare al passo 2 fin quando tutti i gruppi non sono stati elaborati
a questo punto "lo spider" è completato
www.php.net/file
www.php.net/pcre
www.php.net/array
www.php.net/mysql
qui c'è tutto quello che ti serve olter alla sintassi base
PS: consiglio importante...devi mettere tutto in degli array e poi inserisci quando hai tutti i dati in modo che separi nettamente le tue parti e puoi inserire informazioni aggiuntive che estrai dall'insieme dei dati contenuti nei vari array![]()
VM su SSD da 5$! https://www.digitalocean.com/?refcode=f6925c7f0ddb
Rifletterò un po' sui tuoi punti.
Per il momento ti ringrazio!
"La grandezza dell'uomo si misura in base a quel che cerca e all'insistenza con cui egli resta alla ricerca".