Mozilla lança modelo open source de reconhecimento de voz

1 min de leitura
Imagem de: Mozilla lança modelo open source de reconhecimento de voz

Em julho deste ano, a Mozilla pediu a ajuda de seus seguidores e entusiastas para construir um banco de dado de vozes para usar na criação de um modelo open source de reconhecimento vocal. Hoje, a iniciativa acaba de ter a sua primeira versão disponibilizada gratuitamente para o grande público.

“Na Mozilla, estamos muito empolgados com o potencial do reconhecimento de voz. Acreditamos que essa tecnologia pode e irá gerar uma onda de produtos e serviços inovadores, e que isso deveria estar disponível para todos”, escreveu o vice-presidente de estratégia de tecnologia da Mozilla, Sean White.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Lançada em domínio público, a primeira versão da coleção de voz criada pela Mozilla contou com a contribuição de cerca de 20 mil pessoas de várias partes do mundo por meio do projeto Common Voice. O volume de dados de voz oferecidos pela criadora do Firefox e uma das grandes defensores de uma internet livre e aberta na atualidade é o segundo maior do planeta.

DeepSpeech

“Há apenas poucos serviços comerciais de reconhecimento de voz de qualidade disponíveis, dominados por um pequeno número de grandes empresas”, afirmou White. “Isso reduz a escolha do usuário e os recursos disponíveis para startups, pesquisadores ou mesmo grandes companhias que querem tornar dar suporte a comandos de voz em seus produtos e serviços.”

Foi com isso em mente que a Mozilla desenvolveu o projeto DeepSpeech, um motor de conversão de voz para texto open source com base em aprendizagem de máquina e com uma taxa de erro de apenas 6,5%. Ao todo, a iniciativa já conta com mais de 400 mil gravações, com mais de 500 horas de comandos de voz, que podem ser baixadas e utilizadas por desenvolvedores que queiram aplicar suporte a comandos de voz em suas aplicações.

Mais ‘doações’ em breve

Inicialmente, a Mozilla aceitou “doações” de voz apenas em inglês, mas a ideia é ampliar o DeepSpeech com a expansão do Common Voice. De acordo com a companhia, será possível enviar contribuições em outros idiomas a partir do início do primeiro semestre do próximo ano.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Fontes

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.