E' un pò lungo da spiegare. Le soluzioni sono diverse. Comunque posso darti qualche riferimento.
Innanzi tutto puoi usare le classi System.Net e System.IO
Con queste puoi leggere il codice delle pagine del tuo sito, indicando il percorso del file. Dopo, attraverso le opportune funzioni, separi il testo dal codice HTML, e nel testo "pulito" compi la ricerca con algoritmi che dovrai definire.
Scusa la rapidità con cui ti rispondo, ma sono in ufficio e ho pochi minuti a disposizione.A presto.