Premesso che non conosco la libreria HtmlUnit, secondo me ti stai complicando troppo la vita.

Se tutto ciò che devi fare è un'applicazione che ogni 10 minuti estrapola dati da un sito e li salva su un DB, quello che ti serve è solamente una applicazione Java desktop. Non ti serve Java EE, non ti serve una WebApplication, non ti serve un Servlet Container, non ti servono le servlet, non ti servono Application Server, non ti serve nulla di più del normalissimo JDK.

Una WebApplication è, in soldoni, un sito. Non hai bisogno di un sito.
Una Servlet è una componente di una WebApplication che si occupa di rispondere ad una richiesta HTTP. Non è ciò che ti serve.
Un Servlet Container è un "server web"... una grossa applicazione dove girano le web-applications. Non è ciò che ti serve.
Java EE è un framework che sta sopra a Java SE, che offre una miriade di componenti aggiuntivi per lo sviluppo di web-applications e applicazioni Enterprise. Non è ciò che ti serve.

Quello che serve a te sono due cose:

1) Una semplice applicazione che prende i dati da un sito e li salva su un DB
2) Un DB che sia accessibile dall'esterno (da internet).

La prima la puoi sviluppare in due modi:

1) Una semplice applicazione che legge i dati dal sito, li salva su DB. Poi, usando lo scheduler della macchina su cui gira (che siano le "Operazioni Pianificate" di Windows, o il cron di Linux, ecc), pianifichi la sua esecuzione ogni 10 minuti.

2) Una applicazione che sta sempre in esecuzione sulla macchina e che ogni 10 minuti (quindi, usando Timer e TimerTask di java.util) effettua la lettura dei dati dal sito e li salva sul DB.

L'unica vera "difficoltà" è l'avere il DB accessibile da remoto. Generalmente i servizi di hosting non permettono l'accesso al DB da remoto (per ovvie questioni di sicurezza), quindi o trovi un servizio che permetta questo tipo di accesso, oppure rendi pubblica la tua macchina col tuo DB.


Ciao.