PDA

Visualizza la versione completa : Sistema vocale


lorenzofranc
05-05-2014, 00:33
Buonasera potreste darmi qualche delucidazione sui sistemi a comando vocale, premetto che è solamente curiosità.

Tempo fa ho letto in un forum dove si consigliava di programmare in JAVA utilizzando la libreria CMU SPHINX.

Cosa mi sapete dire in merito, sicuramente saprete darmi qualche ottimo consiglio.

paolino_delta_t
05-05-2014, 18:37
Sono programmi che usano la voce come strumento d'input. Se poi vuoi sapere come funzionano, c'è un bel pò di letteratura in merito ( roba complessa in verità ).

M.A.W. 1968
05-05-2014, 21:44
Buonasera potreste darmi qualche delucidazione sui sistemi a comando vocale, premetto che è solamente curiosità.

Dipende dal livello di curiosità e dal tipo di "consigli" che ti aspetti.
In linea di principio, non è proprio alcunché di trascendentale: in fase di "apprendimento" un segnale audio prodotto dalla voce umana (ma non necessariamente) viene digitalizzato, filtrato e ridotto ad una stringa di bit. In seguito (fase di riconoscimento) tale stringa di bit viene confrontata con altri segnali analoghi, utilizzando algoritmi piuttosto evoluti e radicalmente divisi in due categorie: speaker-dependent e speaker-independent. I dettagli matematici che sustanziano tali algoritmi sono di elevato interesse e di altrettanto elevata complessità.
Se il riconoscimento, in ambedue i casi, ha esito positivo, ciò può poi dare luogo ad ogni sorta di evento arbitrariamente complesso, sotto il controllo del relativo programma. E' quindi banalmente possibile, ad esempio, associare comandi a suoni, tipicamente parole o frasi.

Esistono apposite librerie di riconoscimento vocale per quasi ogni linguaggio normalmente diffuso nel mainstream, e anche per qualcuno dei più esotici (ad esempio, Haskell...). Consigliare l'una o l'altra senza conoscere numerosi dettagli, che hai omesso, è nel migliore dei casi un esercizio poco utile.

L'unica nota che è sensato aggiungere è che il riconoscimento vocale effettuato su una macchina esorbitantemente potente come il PC appare quasi uno spreco in confronto al concentrato di tecnologia algoritmica e di potenza elaborativa degli appositi chip dedicati, che da oltre un decennio (e se si parla di tecnologia DAST per la basilare riproduzione vocale andiamo indietro di almeno venticinque anni) in pochi mmq di silicio offrono le prestazioni delle migliori librerie commerciali quanto a riconoscimento, sintesi, apprendimento vocale.

lorenzofranc
07-05-2014, 10:54
Grazie a tutti e due
M.A.W. 1968 (http://forum.html.it/forum/member.php?userid=183535) ti sono grato per tutti i particolari descritti

Loading