Può interessarti questo?
http://sourceforge.net/projects/archive-crawler

L'ho trovato con una ricerca veloce su SourceForge ma non so effettivamente come funzioni.