Ma allora è la prima no? Dato un testo, un software lo "legge" producendo un audio, che può essere ascoltato e/o registrato.
Questi servizi/software si chiamano "text to speech".