Estamos na aurora de um novo tempo no setor da inteligência artificial (IA), com a implementação de diferentes usos para algoritmos e aprendizagem de máquina. Já tivemos máquinas “sonhando” e “criando” a partir de suas próprias conclusões e agora estamos diante de mais uma dessas experiências: uma ferramenta online que usa suas palavras para gerar imagens. Os resultados por enquanto são surrealistas e lisérgicos, dignos de um sonho — ou de um pesadelo.

Criado por Cristóbal Valenzuela, a página usa um sistema chamado AttnGAN (Attentional Generative Adversarial Network, ou algo como “Rede Adversarial Geradora de Atenção”), que foi projetado para aprimorar IAs que transformam textos em imagens. A partir desse treinamento, a ideia é que em breve ela possa refinar seus resultados e apresentar amostras mais próximas do texto.

No artigo, Valenzuela explica que os programas mais antigos formavam imagens a partir de sentenças completas, o que não gerava o esperado. O novo método aborda uma visão mais ampla a partir de cada palavra e vai montado o resultado aos poucos em tempo real. Teste aqui e veja que doido.

inteligência artificial

O pessoal do Gizmodo Brasil entrou em contato com uma das autoras do projeto, que falou sobre a dificuldade de uma máquina construir a atenção, que é um conceito humano. O aprendizado profundo e a visão computacional são capazes de identificar doenças, humanos e carros, entretanto, ainda não é possível concluir que a IA seja capaz de entender o mundo visual — por mais que ela possua os dados, ainda é difícil usá-los para criar.

“Embora o AttnGAN tenha um desempenho muito melhor que os sistemas mais modernos em termos de síntese de texto para imagem, gerar imagens realistas com objetos de múltiplas categorias ainda é um problema em aberto na comunidade. E gostaríamos de investigar mais nessa direção no futuro”, diz Tao Xu, da Universidade Lehigh, nos Estados Unidos.