Detectar atividade de voz (VAD)
O Voice Activity Detection - ou VAD - é uma ferramenta que utilizamos para detectar silêncios na fala para pausar/retomar a gravação. Desta forma, o usuário pode agilizar o processo de laudar sem a necessidade de iniciar ou parar as gravações, pois a detecção de atividade de voz faz esse trabalho.
Funcionamento básico
O VAD é ativado passando dois parâmetros na inicialização: useVAD
que recebe true
e input
que recebe browsermic
.
IMPORTANTE: esta funcionalidade não pode ser utilizada com inputauto
ouspeechmike
.
Com o VAD ativo dois eventos são disparados: iaraSpeechRecognitionVADVoiceStart que detecta a atividade de voz e iaraSpeechRecognitionVADVoiceStop que detecta quando não há atividade de voz.
Dica: O VAD também utiliza doseventos
demonstrados na abaFuncionamento
na seção Eventos.
Utilização básica
Lembre-se de escutar os eventos iaraSpeechRecognitionVADVoiceStart
e iaraSpeechRecognitionVADVoiceStop
:
//Eventos adicionados após o reconhecedor ser instanciado, mas antes de ser iniciado.
var recognition = new IaraSpeechRecognition();
recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStart",
function (event) {
console.log("Atividade de voz detectada ...");
console.log(JSON.stringify(event.detail, null, 4));
}
);
recognition.addEventListener(
"iaraSpeechRecognitionVADVoiceStop",
function (event) {
console.log(
"Paramos de detectar atividade de voz, começe a falar novamente para transcrevermos."
);
console.log(JSON.stringify(event.detail, null, 4));
}
);
recognition
.init({
userId: myUserId,
apiToken: myApiToken,
forceConnection: true,
interimResults: true,
input: "browsermic",
useVAD: true,
})
.done(function (e) {
console.log('Pronto para gravar. Pressione o botão "Iniciar".');
recognition.onstart = function () {
console.log("Estamos escutando ...");
};
recognition.onstop = function () {
console.log("Gravação finalizada.");
};
});
Dica: veja a seção Reconhecimento de voz para saber mais sobre o reconhecimento da Iara.