Microsoft lança serviço de reconhecimento de face e fala para vídeos

1 min de leitura
Imagem de: Microsoft lança serviço de reconhecimento de face e fala para vídeos

O Video Indexer já está disponível para uso na Microsoft Azure, plataforma de aplicativos e serviços de computação em nuvem da Microsoft. O recurso nada mais é do que um serviço em nuvem que permite a extração de dados visuais e falados em vídeos, que podem ser utilizados para a busca de informações e melhoria de experiência em aplicativos e outras plataformas.

Recentemente anunciado na International Broadcasters Conference de 2018 (Conferência Internacional de Emissoras), o Microsof Video Indexer foi desenvolvido com base em inteligência artificial e tecnologia em nuvem. Nesse caso, para que fosse possível entregar as informações necessárias, foi aplicado o método de análise de machine leaning (aprendizado de máquina), com o uso de um banco de dados de áudios e vídeos, que continuamente será alimentado pela Microsoft Research.

De acordo com uma publicação oficial da companhia, a funcionalidade tem alto poder de compreender tópicos avançados de diferentes tipos de emoção, avaliando conteúdos de fala e entonação de voz. Além disso, possui reconhecimento facial de celebridades, função que foi desenvolvida com base em dados geralmente buscados em referências, como IMDb, Wikipedia e top influencers do LinkedIn. O Microsof Video Indexer também conta com detecção automática e tradução de idiomas, transcrição de áudio, detecção de cena, moderação de conteúdo visual, dentre outros.

A companhia ainda garante que a funcionalidade tem interface simples e intuitiva, de modo que os seus usuários possam fazer customizações sem precisar escrever códigos de programação. Para usá-la, é preciso ser assinante da Azure, mas também é oferecido um período gratuito de testes. Até o momento, ela está disponível somente para algumas partes dos Estados Unidos, Europa e Ásia Oriental.

Para quem foi criado o Microsoft Video Indexer?

Segundo a Microsoft, o serviço é indicado para quem precisa fazer pesquisas constantes em bibliotecas de vídeo, já que ele localiza rapidamente momentos de fala, rostos de pessoas e palavras-chave relevantes. Nesse caso, pode ser necessário para emissoras, agências de notícias e entretenimento, além de instituições de ensino. Pode também ser atrativo para o ramo publicitário, já que facilita a busca de dados importantes para melhor alcance de anúncios.

Até o momento, algumas empresas do setor midiático e tecnológico estão usando a plataforma, como Endemol, AVID e Box. Por aqui ainda não há previsão para sua chegada.

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.