menu
Logo TecMundo
Software

IA usa suas palavras para criar imagens surrealistas dignas de pesadelos

Projeto tenta fazer com que algoritmos consigam transformar textos em imagens em tempo real

schedule20/08/2018, às 15:00

IA usa suas palavras para criar imagens surrealistas dignas de pesadelosFonte: Cristóbal Valenzuela

Imagem de IA usa suas palavras para criar imagens surrealistas dignas de pesadelos no tecmundo

Estamos na aurora de um novo tempo no setor da inteligência artificial (IA), com a implementação de diferentes usos para algoritmos e aprendizagem de máquina. Já tivemos máquinas “sonhando” e “criando” a partir de suas próprias conclusões e agora estamos diante de mais uma dessas experiências: uma ferramenta online que usa suas palavras para gerar imagens. Os resultados por enquanto são surrealistas e lisérgicos, dignos de um sonho — ou de um pesadelo.

Criado por Cristóbal Valenzuela, a página usa um sistema chamado AttnGAN (Attentional Generative Adversarial Network, ou algo como “Rede Adversarial Geradora de Atenção”), que foi projetado para aprimorar IAs que transformam textos em imagens. A partir desse treinamento, a ideia é que em breve ela possa refinar seus resultados e apresentar amostras mais próximas do texto.

smart_display

Nossos vídeos em destaque

No artigo, Valenzuela explica que os programas mais antigos formavam imagens a partir de sentenças completas, o que não gerava o esperado. O novo método aborda uma visão mais ampla a partir de cada palavra e vai montado o resultado aos poucos em tempo real. Teste aqui e veja que doido.

inteligência artificial

O pessoal do Gizmodo Brasil entrou em contato com uma das autoras do projeto, que falou sobre a dificuldade de uma máquina construir a atenção, que é um conceito humano. O aprendizado profundo e a visão computacional são capazes de identificar doenças, humanos e carros, entretanto, ainda não é possível concluir que a IA seja capaz de entender o mundo visual — por mais que ela possua os dados, ainda é difícil usá-los para criar.

“Embora o AttnGAN tenha um desempenho muito melhor que os sistemas mais modernos em termos de síntese de texto para imagem, gerar imagens realistas com objetos de múltiplas categorias ainda é um problema em aberto na comunidade. E gostaríamos de investigar mais nessa direção no futuro”, diz Tao Xu, da Universidade Lehigh, nos Estados Unidos.