O Google anunciou a tecnologia de modelos de IA Gemini Omni nesta terça-feira (19), durante o evento Google I/O. A tecnologia é vista como um modelo de IA que pode criar qualquer coisa, a partir de qualquer comando, segundo a companhia. Um desses recursos fica disponível hoje mesmo.
O Omni combina as características da tecnologia do Gemini com as capacidades do Google em gerar imagens e vídeos. O Google cita que ele traz um melhor entendimento dos comandos e contexto. Diferente do Nano Banana, por exemplo, esse modelo consegue criar conteúdos com mais realismo em áreas como energia cinética e dinâmica dos fluídos.
Nossos vídeos em destaque
Em um dos exemplos, o usuário pode solicitar ao Gemini Omni que ele crie um vídeo que explique detalhadamente a função de proteínas de um organismo. O resultado é um material mais denso e realista, que visa obedecer os comandos do usuário de maneira mais fidedigna.
)
Um dos pontos mais interessantes do Gemini Omni tem relação direta com seu fator multimodal. Isso significa que na criação dos conteúdos será possível combinar imagens, vídeos, textos e faixas sonoras por meio dos comandos. Será possível falar sua solicitação ou escrevê-la.
A empresa salienta que o Omni não cria somente cenas mais reais, mas também raciocina sobre os próximos passos daquele conteúdo. O intuito é combinar os conhecimentos do modelo sobre história, ciência e contexto cultural durante a geração dos vídeos e imagens.
A partir de hoje, a empresa disponibiliza o Gemini Omni Flash aos assinantes dos planos Google AI Plus, Pro e Ultra. Esse recurso também chega ainda nesta semana ao YouTube e YouTube Shorts e estará disponível em breve para desenvolvedores.
O Google também anunciou o Gemini Spark, um novo agente de IA pessoal que trabalha durante todo o tempo sem a supervisão do usuário. Siga o TecMundo no X, Instagram, Facebook e YouTube e assine a nossa newsletter para receber as principais notícias e análises diretamente no seu e-mail.
)
)
)
)
)
)
)