Google gera vídeos com IA a partir de frases simples

1 min de leitura
Imagem de: Google gera vídeos com IA a partir de frases simples
Imagem: Google/Divulgação

O Google mostrou como pode produzir conteúdo audiovisual a partir de frases simples utilizando tecnologia de Inteligência Artificial (IA). Com um próprio vídeo, a companhia detalhou o Imagen Video, um sistema que foi treinado com 14 milhões de pares de vídeo-texto e 60 milhões de pares de imagem-texto.

(Fonte: Google/Divulgação)(Fonte: Google/Divulgação)Fonte:  Google/Divulgação 

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

A companhia comemora o feito e destaca os seus diferenciais. “Além de gerar audiovisual de alta definição, o Imagen Video tem um grau de controle e de conhecimento de mundo, incluindo a habilidade de gerar vídeos diversos e animações de texto em vários estilos artísticos”, afirma um artigo publicado pela empresa.

(Fonte: Google/Divulgação)(Fonte: Google/Divulgação)Fonte:  Google/Divulgação 

De acordo com a Big Tech, a tecnologia demonstrou a capacidade de compreender a profundidade de campo e a tridimensionalidade. Isso possibilita a criação de vídeos simulando um voo de drone, girando e capturando objetos sem distorcer a sua imagem.

Como funciona o Imagen Video?

(Fonte: Google/Divulgação)(Fonte: Google/Divulgação)Fonte:  Google/Divulgação 

O Imagen Video produz arquivos com baixa resolução para aumentar a definição a partir de algoritmos. Com a descrição da imagem, o aplicativo gera um clipe em 16 quadros, com três quadros por segundo e uma resolução baixíssima de 24 por 48 pixels.

Em seguida, faz um upscale complementando os quadros para resultar em um arquivo de 128 quadros, ou 24 quadros por segundo em 1280 x 760, com cinco segundos no total. Essa duração não é suficiente para se fazer uso em larga escala, tanto comercial ou educacional.

Assim como o Make-A-Video oferecido pela Meta, o Imagen Video distorce alguns quadros do vídeo, além de misturar objetos fisicamente de uma forma artificial. A equipe de pesquisadores planeja combinar esforços com o Phenaki, um sistema de texto recém-lançado pelo Google que consegue gerar clipes com mais de dois minutos em qualidade inferior.


smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.