Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 11
  1. #1

    Web spider (quale linguaggio scegliere)

    Ciao a tutti dovrei creare un web spider in grado di essere eseguito anche per ore o giornate senza interruzioni.

    Lo spider girerebbe su in Mac o un pc UNIX in locale. Poi una volta al giorno Il database remoto sul web server verrebbe aggiornato con il db locale.

    Quale linguaggio scegliereste ?

    Io pensavo a Python, Perl o Php ma non sapendo se si prestano ad essere eseguiti per pre valuto anche delle alternative.

    Grazie

  2. #2
    Credo che tutti e tre i linguaggi che indichi vadano bene, dato che forniscono strumenti per scaricare le pagine e interfacciarsi con un DB, e in ogni caso, anche se non sono il massimo dal punto di vista delle performance, non ha alcuna importanza, dato che in un web spider il collo di bottiglia in genere è la rete.
    Amaro C++, il gusto pieno dell'undefined behavior.

  3. #3
    Utente di HTML.it L'avatar di rsdpzed
    Registrato dal
    Aug 2001
    Messaggi
    764
    in linea di massima sono daccordo anch'io ma se dovessi scegliere sceglierei python.

    Perl come linguaggio, sintassi ecc. non mi piace ma è un personalissimo parere (forse anche abbastanza condiviso ). Php lo escluderei per via della dipendenza con apache, un programma che deve girare per ore su un sistema che è concepito per servire richieste http in un certo lasso di tempo la vedo un po' come una forzatura. Non che non si possa fare ma di certo non è la via piu veloce secondo me.
    Pyton o java imho.

  4. #4
    Utente di HTML.it L'avatar di Scara95
    Registrato dal
    Jul 2009
    residenza
    Zimella (VR)
    Messaggi
    2,590
    Originariamente inviato da rsdpzed
    in linea di massima sono daccordo anch'io ma se dovessi scegliere sceglierei python.

    Perl come linguaggio, sintassi ecc. non mi piace ma è un personalissimo parere (forse anche abbastanza condiviso ). Php lo escluderei per via della dipendenza con apache, un programma che deve girare per ore su un sistema che è concepito per servire richieste http in un certo lasso di tempo la vedo un po' come una forzatura. Non che non si possa fare ma di certo non è la via piu veloce secondo me.
    Pyton o java imho.
    Volendo ci sono progetti per compilare PHP per JVM o CLR, non mi ricordo se ce ne sono addiritura come codice nativo...
    In ogni caso questa è un'altra storia...
    "Quid enim est, quod contra vim sine vi fieri possit?" - Cicerone, Ad Familiares

  5. #5
    non escludere bash crontab, awk.
    php puoi usarlo anche senza Apache:
    codice:
    $ php -r 'echo "Hello World!\n";'
    Hello World!

  6. #6
    Originariamente inviato da rsdpzed
    in linea di massima sono daccordo anch'io ma se dovessi scegliere sceglierei python.
    Anch'io, ma perché lo conosco meglio e lo preferisco agli altri due linguaggi citati ; per il resto, direi che per un compito del genere pressoché si equivalgono, e il fattore fondamentale per la scelta diventa più che altro il livello di conoscenza di tali linguaggi, ed eventualmente, se lo spider deve eseguire elaborazioni particolari sui dati raccolti, dall'esistenza di librerie che le facilitino in un linguaggio o nell'altro. Le medesime considerazioni si applicano credo più o meno a tutti gli altri strumenti citati.
    Amaro C++, il gusto pieno dell'undefined behavior.

  7. #7
    Utente di HTML.it L'avatar di rsdpzed
    Registrato dal
    Aug 2001
    Messaggi
    764
    Originariamente inviato da MacApp
    non escludere bash crontab, awk.
    php puoi usarlo anche senza Apache:
    codice:
    $ php -r 'echo "Hello World!\n";'
    Hello World!
    devo ammettere che non ero a conoscenza di questa possibilità, chiedo venia.

  8. #8
    Originariamente inviato da rsdpzed
    in linea di massima sono daccordo anch'io ma se dovessi scegliere sceglierei python.

    Perl come linguaggio, sintassi ecc. non mi piace ma è un personalissimo parere (forse anche abbastanza condiviso ). Php lo escluderei per via della dipendenza con apache, un programma che deve girare per ore su un sistema che è concepito per servire richieste http in un certo lasso di tempo la vedo un po' come una forzatura. Non che non si possa fare ma di certo non è la via piu veloce secondo me.
    Pyton o java imho.
    Pensavo anche io a Python l'unica cosa è che dovrei iniziare da zero ... Bhe potrebbe essere un occasione per apprenderlo

  9. #9
    Utente di HTML.it L'avatar di Scara95
    Registrato dal
    Jul 2009
    residenza
    Zimella (VR)
    Messaggi
    2,590
    Originariamente inviato da jr1980
    Pensavo anche io a Python l'unica cosa è che dovrei iniziare da zero ... Bhe potrebbe essere un occasione per apprenderlo
    Le basi di python sono semplici da apprendere, la sintassi (se sei abituato ad identare decentemente) è molto semplice e sembra che il linguaggio voglia farsi imparare...
    "Quid enim est, quod contra vim sine vi fieri possit?" - Cicerone, Ad Familiares

  10. #10
    Originariamente inviato da MacApp
    non escludere bash crontab, awk.
    php puoi usarlo anche senza Apache:
    codice:
    $ php -r 'echo "Hello World!\n";'
    Hello World!
    In sostanza posso eseguire un file es. Miospider.php direttamente da linea di comando ? Come fosse un applicazione classica? Funziona anche su Mac ? corro a documentarmi

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.