Nvidia já vem experimentando a criação de pessoas e cenários artificiais há algum tempo, com sua rede neural chamada Generative Advesarial Networks (GAN), e a cada temporada ela chega a resultados impressionantes — mais recentemente, a companhia mostrou, por exemplo, como produz mundos virtuais em tempo real. Agora, ela elevou o assunto para um patamar superior.

Os pesquisadores conseguiram ajustar um sofisticado sistema de combinações, baseado em tópicos de estilos, que leva em consideração todas as nuances do rosto de uma pessoa. As técnicas aplicadas por aqui foram usadas anteriormente para chegar a vários resultados fotorrealistas em amostras de design industrial, interiores, objetos e até em jogos de computador.

A partir daí, os cientistas treinaram um algoritmo que mistura atributos como a cor da pele, formato do nariz e da boca, entre outras coisas — até o plano de fundo entra na jogada. Depois de algumas rodadas de interpolação, o software então usa uma programação de ajustes dos ruídos para refinar os resultados aleatórios.

ia rostoFonte: Nvidia

Para isso, foram usadas mais de 70 mil fotos de rostos em uma parceria com o Flickr e auxílio da plataforma Mechanical Turk, da Amazon, para auxiliar na remoção de detalhes que poderiam confundir a máquina no processo, a exemplo de estátuas e objetos semelhantes. Como você pode ver no vídeo abaixo, é impressionante — e isso vem sendo usado também em outras frentes, como em quartos de hotel ou carros:

“O novo gerador otimiza o estado da arte em termos de métricas tradicionais de qualidade de distribuição, leva a melhores propriedades de interpolação e também desembaraça os fatores latentes de variação com mais eficiência”, destaca o documento do estudo. Ou seja, vai ficar cada vez mais difícil crer no que nossos olhos podem ver.