Dovrebbe essere semplice?!?
Non direi proprio.... a cominciare dalla mole di materiale che ti devi studiare (spero che tu conosca bene l'inglese) il protocollo di comunicazione.
Un altra cosa... ti interessa anche aggiungere il supporto per le pagine dinamiche? I parser li vuoi scrivere tu, o cerchi dei moduli a parte da integrare con il tuo programma?
Comunque se fossi in te lo scriverei in C++, visto che se prende piede un lavoro cosi' le prestazioni diventano importanti.
Comincia con lo studiarti il protocollo HTTP.