Non so quanti si ricorderanno di MozDex.
Se ne aprlò un paio di volte, riguardo ai nuovi scenari sui motori.
Un esempio http://forum.html.it/forum/showthrea...ghlight=mozdex
Nella mia solita lettura periodica dei log dei server ecco che mi imbatto in un nuovo spider con unser agent
Dando una lettura alla documentazione in http://www.nutch.org/docs/en/bot.html spicca subito la verosimiglianza con la struttura del motore in questione ed infatti leggendo qua e là ecco che si scopre che http://www.mozdex.org/engine.html prosegue nel suo lavoro (oramai da diversi mesi, chissà quale sorpresa conserva) ed ora ha anche un suo spider.NutchCVS/0.05 (Nutch; http://www.nutch.org/docs/en/bot.html; nutch-agent@lists.sourceforge.net)
Dopo aver quindi digerito i dati di Dmoz, aver accettato submission esterne ecco che ora il nuovo panorama è uno spider che sta curiosando qua e là.
Ho pensato potesse interessare qualche utente curioso sull'andamento di nuovi motori ed anche qualche eventuale lettore di statistiche incuriosito da questo nuovo spider.
Ne approfitto anche per segnalare che lo spider in questione risulta liberamente scaricabile ed utilizzabile secondo licenza.
Non ho approfondito il discorso, ma a vedere dalla documentazione direi che ha buona parte di sviluppo in java.![]()