Apple quer reconhecimento de voz mais inteligente e intuitivo no futuro

1 min de leitura
Imagem de: Apple quer reconhecimento de voz mais inteligente e intuitivo no futuro

A Siri foi introduzida originalmente em 2014, junto do iOS 8 e do iPhone 6, e vem sendo ampliada desde então. Parte dos objetivos para o futuro da assistente virtual foi detalhada pela equipe da Apple responsável por ela no resumo de um estudo desenvolvido pelo grupo que será apresentado durante uma conferência internacional de processamento de fala (ICASSP).

Durante o texto, os engenheiros da Apple explicam um pouco sobre o funcionamento do recurso, afirmando que o autor da fala é mais importante de ser reconhecido do que a fala em si.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

“O objetivo geral do reconhecimento de fala é certificar a identidade de uma pessoa usando a sua voz”, escrevem os engenheiros da Siri. “Estamos interessados em ‘quem está falando’, em oposição ao problema de reconhecimento de fala, que visa se certificar ‘o que foi dito’”, complementam.

Assim, quando alguém fala “E aí, Siri”, o sistema precisa ser ágil em identificar de quem é a voz Contudo, o material disponível é bem pequeno, afinal a frase é curta, e isso exige um processamento agilizado. Esse cenário torna necessária uma fase de treinamento quando o aparelho é configurado pela primeira vez, com o usuário lendo algumas frases para passar informações vocais ao sistema.

SiriA Apple quer tornar a Siri ainda mais inteligente e funcional no futuro.

Esse processo inicial, porém, tem pouca “variabilidade ambiental”, nome dado ao conteúdo adquirido de forma mais natural conforme o usuário conversa de forma natural com o iPhone. A sequência de familiarização com a voz do dono gerada a partir disso é chamada de “inscrição implícita” e amplia o conhecimento da Siri, tornando ainda mais simples e preciso o reconhecimento vocal ao longo do tempo.

Há ainda um processo de comparação: a Siri armazena localmente (por questões de segurança) o dono do dispositivo usando o seu comando inicial e é capaz de comparar as informações quando algum algoritmo é atualizado. Isso também ajuda a manter o procedimento seguro e funcional.

Futuro

Para o futuro, a Apple espera ter um sistema ainda mais inteligente e intuitivo, chegando ao ponto de até mesmo dispensar o treinamento inicial para criar um perfil vocal de seu usuário.

“Olhando ainda mais para adiante, imaginamos um futuro sem qualquer passo de inscrição explícita no qual os usuários apenas usam o recurso ‘E aí, Siri’ de um perfil vazio e que cresce e é atualizado organicamente conforme surgem mais requisições ‘E aí, Siri’”, relatam os especialistas da Maçã.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Fontes

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.