Reconhecimento de voz da Microsoft tem menor margem de erro já alcançada

1 min de leitura
Imagem de: Reconhecimento de voz da Microsoft tem menor margem de erro já alcançada
Avatar do autor

Um novo recorde foi anunciado pela Microsoft em relação ao seu sistema de reconhecimento de voz: a plataforma é capaz de entender praticamente tudo o que capta por meio de fala, errando em apenas 5,1% das vezes. O valor é mais baixo do que o atingido em 2016, que não compreendia 5,9% das informações recebidas.

Para realizar esses testes, um conjunto de registros de conversas telefônicas foi utilizado. Chamado Switchboard, essa plataforma é a mesma usada desde os anos 1990 para realizar testes padronizados em sistemas de reconhecimento de voz. A melhora apresentada em relação ao ano passado deve-se a alterações no sistema de modelos acústicos e de linguagem com base em rede neural.

Entendendo antes de ser dito

A Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas

A Microsoft também fortaleceu o modelo de reconhecimento de linguagem usando um sistema que consegue prever o que vai ser dito de acordo com o contexto do diálogo, uma das características-chave que nos ajudam a entender conversas no dia a dia. Isso é feito com a análise do histórico de trocas de informações por meio da fala – e a inteligência artificial do sistema cuida do resto.

Tendo como objetivo desenvolver um sistema de compreensão de voz similar à dos humanos há praticamente 25 anos, a Microsoft atinge um marco importante para o futuro dessa tecnologia – agora, as máquinas são capazes de nos compreender (pelo menos literalmente) tanto quanto outras pessoas.

Comentários

Conteúdo disponível somente online
Veja também
Reconhecimento de voz da Microsoft tem menor margem de erro já alcançada