Pular para o conteúdo principal

Detectar atividade de voz (VAD)

O Voice Activity Detection - ou VAD - é uma ferramenta que utilizamos para detectar silêncios na fala para pausar/retomar a gravação. Desta forma, o usuário pode agilizar o processo de laudar sem a necessidade de iniciar ou parar as gravações, pois a detecção de atividade de voz faz esse trabalho.

Funcionamento básico

O VAD é ativado passando dois parâmetros na inicialização: useVAD que recebe true e input que recebe browsermic.

IMPORTANTE: esta funcionalidade não pode ser utilizada com input auto ou speechmike.

Com o VAD ativo dois eventos são disparados: iaraSpeechRecognitionVADVoiceStart que detecta a atividade de voz e iaraSpeechRecognitionVADVoiceStop que detecta quando não há atividade de voz.

Dica: O VAD também utiliza dos eventos demonstrados na aba Funcionamento na seção Eventos.

Utilização básica

Lembre-se de escutar os eventos iaraSpeechRecognitionVADVoiceStart e iaraSpeechRecognitionVADVoiceStop:

//Eventos adicionados após o reconhecedor ser instanciado, mas antes de ser iniciado.

var recognition = new IaraSpeechRecognition();

recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStart",
function (event) {
console.log("Atividade de voz detectada ...");
console.log(JSON.stringify(event.detail, null, 4));
}
);

recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStop",
function (event) {
console.log(
"Paramos de detectar atividade de voz, começe a falar novamente para transcrevermos."
);
console.log(JSON.stringify(event.detail, null, 4));
}
);

recognition
.init({
userId: myUserId,
apiToken: myApiToken,
forceConnection: true,
interimResults: true,
input: "browsermic",
useVAD: true,
})
.done(function (e) {
console.log('Pronto para gravar. Pressione o botão "Iniciar".');

recognition.onstart = function () {
console.log("Estamos escutando ...");
};

recognition.onstop = function () {
console.log("Gravação finalizada.");
};
});
Dica: veja a seção Reconhecimento de voz para saber mais sobre o reconhecimento da Iara.