Ciao,
dovresti iniziare a installare SDK, voci e Speech Recognition.

SDK : (MicrosoftSpeechPlatformSDK.msi)
TTS (se ti serve Text To Speech che puoi utilizzare al posto del mp3...) : (MSSpeech_TTS_it-IT_Lucia.msi)
SR (Speech Recognition con il quale puoi impartire i comandi) : (MSSpeech_SR_it-IT_TELE.msi)
Runtime : (SpeechPlatformRuntime.msi).

non sono certo di averli messi tutti, ma credo di si.

questi sono i file se vuoi utilizzare l'italiano... ovviamente ci sono anche in altre 25 lingue, anche se attualmente l'inglese, il francese, lo spagnolo e il tedesco dispongono anche della possibilità di dettare testo libero, mentre le altre, compreso l'italiano, dispongono solo di comandi vocali, non è possibile dettare testo libero... in pratica con l'italiano aggiungi attraverso la grammar il testo risultante legato a delle parole specifiche preimpostate. ma per quello che vuoi fare tu va più che bene, infatti ti basterebbe impostare una sorta di menù e sotto menù vocali collegati ai nomi degli mp3 in una determinata cartella (ad esempio), questi poi li utilizzi come testo del comando vocale.