Premetto che uso Mozilla su linux, e la cosa funziona, anche se sta scritto che serve un SO Windows per le interazioni corrette. Magari dovrebbe anche cambiare figura al cambio della persona nel form, cosa che nonfa sul mio browser.

Ho dato un'occhiata veloce al codice.
Una parte e` fatta in JS, poi pero` vengono fatti dei richiami ad un oggetto che non so cosa sia (VHSS) e che forse ha scaricato dal server.

Per il tempo che impiega a rispondere (in qualsiasi lingua) potrebbe anche fare una chiamata al server ed attendere la risposta in qualche formato tipo .WAV o .MP3 compresso.
Comunque non si basa su un vocabolario (ho provato a fargli dire in inglese una frase scritta in italiano, e ci ha provato), quindi funziona in base a regole di pronuncia.

A parte l'interazione vocale, e` anche un esempio di come si settano le opzioni di una select dipendente da un'altra.