Saltar para el contenido principal

Detección de actividad vocal (VAD)

El Voice Activity Detection (VAD) es una herramienta que utilizamos para detectar los silencios en el habla para pausar/retomar la grabación. De este modo, el usuario puede acelerar el proceso de laudación sin necesidad de iniciar o detener las grabaciones, ya que la detección de la actividad de la voz se encarga de este trabajo.

Funcionamiento básico

El VAD se activa pasando dos parámetros en la inicialización: useVAD que obtiene true y input que obtiene browsermic.

IMPORTANTE: esta función no se puede utilizar con la entrada auto o el speechmike.

Con el VAD activo se ejecutan dos eventos: iaraSpeechRecognitionVADVoiceStart que detecta la actividad de voz y iaraSpeechRecognitionVADVoiceStop que detecta cuando no hay actividad de voz.

Consejo: VAD también utiliza los eventos demostrados en la pestaña de Operación en la sección de Eventos.

Utilización básica

Recuerda escuchar los eventos iaraSpeechRecognitionVADVoiceStart e iaraSpeechRecognitionVADVoiceStop:

//Eventos añadidos después de la instanciación del reconocedor, pero antes de que se inicie.

var recognition = new IaraSpeechRecognition();

recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStart",
function (event) {
console.log("Actividad de voz detectada ...");
console.log(JSON.stringify(event.detail, null, 4));
}
);

recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStop",
function (event) {
console.log ("Dejamos de detectar la actividad de la voz, empieza a hablar de nuevo para que la transcribamos."
);
console.log(JSON.stringify(event.detail, null, 4));
}
);

recognition
.init({
userId: myUserId,
apiToken: myApiToken,
forceConnection: true,
interimResults: true,
input: "browsermic",
useVAD: true,
})
.done(function (e) {
console.log('listo para grabar. Pulse el botón "Inicio"..');

recognition.onstart = function () {
console.log("Estamos escutando ...");
};

recognition.onstop = function () {
console.log("Grabación finalizada.");
};
});
Pista: consulte la sección Reconocimiento de voz para saber más sobre el reconocimiento de Iara.