Facilitar o acesso de todos é o novo mote de acessibilidade do YouTube. Até recentemente o site de vídeos mais frequentado do mundo interpretava esse conceito como “poder ver um vídeo de qualquer lugar”, seja em um desktop ou no celular. Agora a ideia é permitir que pessoas com deficiência auditiva ou que não sejam fluentes em inglês também possam usufruir do serviço.

O sistema funciona de forma semelhante ao closed caption dos canais de TV normais. Um programa de reconhecimento de fala captura e decodifica o conteúdo verbal do vídeo, transformando-o em legendas.

Para todas as pessoas

Qualquer pessoa pode se aproveitar do auto-caption do YouTube. Além das pessoas com problemas de audição, qualquer um que esteja estudando o inglês como idioma estrangeiro pode se beneficiar do sistema.

O primeiro caso – quem tem dificuldades auditivas, ou mesmo a falta desse sentido – tem aplicações de inclusão. No vídeo a seguir (em inglês) você acompanha a alegria dos estudantes da California School for the Deaf (Escola para surdos da Califórnia), em Fremont, ao testar a novidade:

Porém, ainda deve demorar algum tempo para que todos os vídeos que cumpram os requisitos recebam o auto-captioning. O pessoal do YouTube recomenda que os usuários que tiverem problemas habilitando o sistema em seus uploads antigos visitem o Help Center do site.

Para todo o mundo

Exemplo de Closed Caption, como acontece na TV. O YouTube terá sistema semelhante.Com o tempo e o desenvolvimento de novas ferramentas mais poderosas, devem-se incluir outros idiomas e melhores capacidades de tradução da palavra falada em escrita, e os programadores responsáveis pelo auto-caption já estão trabalhando nesse sentido.

Segundo Mike Cohen, especialista em reconhecimento de fala do Google, são vários os empecilhos para que a tecnologia atinja seu objetivo final. Cada idioma tem suas particularidades e estruturas, o que gera uma quantidade enorme de regras para o reconhecimento. Somando-se a isso o extenso vocabulário das línguas modernas, os sotaques e dialetos o cenário torna-se extremamente complexo.

Outro problema para a transcrição perfeita é a qualidade do áudio nos vídeos. Barulhos de fundo, captação ruim e até mesmo problemas de fala e dicção do interlocutor tornam-se vilões de alta estirpe para o software de reconhecimento.

Requisitos e alertas

Ken Harrenstein, engenheiro de software do Google, comentou que em um dos testes as palavras SIM card – o chip dos celulares GSM – foi transcrita como salmon (salmão, em inglês). Assim, para que o sistema funcione perfeitamente, a dicção e a clareza na voz do interlocutor devem ser exemplares .

O software de reconhecimento de fala do Google é extremamente avançado, porém ainda está longe de ser perfeito. Falhas de captação, problemas da faixa de áudio e qualquer idioma além do inglês ainda estão além da capacidade da nova funcionalidade.

Com o tempo, a situação só tende a melhorar, mas por enquanto, a grande ideia é aproveitar para praticar o inglês com o melhor da filmografia da web.

Cupons de desconto TecMundo: