Treinar uma máquina para vencer sozinha jogos que exigem muito raciocínio humano, a exemplo de xadrez ou Go, já é uma realidade para o campo da inteligência artificial (IA), com o chamado reforço de aprendizado. Agora, cientistas da Universidade da Califórnia em Irvine deram um passo adiante: eles criaram o DeepCube, um sistema que precisou do mínimo de supervisão para conseguir bater por si só um tradicional cubo mágico em apenas 44 horas.

Também chamado de Cubo de Rubik, ele foi criado pelo húngaro Erno Rubik em 1974 e oferece um quebra-cabeças tridimensional com mais de 43 quintilhões de combinações e pode ser resolvido com o mínimo de 26 movimentos. O brinquedinho faz muito sucesso até hoje e já vendeu mais de 350 milhões de unidades desde a sua criação — inclusive, até ganhou algumas variações para aumentar o desafio.

Para superar o cubo, os pesquisadores precisaram ir um pouco além do que foi observado nos experimentos com xadrez e Go. Isso porque o sucesso em turnos ação com os espaços não são baseados em recompensas da mesma forma e assim o computador precisa ser orientado de outra maneira para saber se está indo corretamente rumo a alguma solução.

Como funciona esse sistema?

Stephen McAleer e seus colegas da Universidade da Califórnia em Irvine criaram uma nova técnica de aprendizado profundo, chamada de “iteração autodidática”, que pode ensinar a IA a criar seu próprio sistema de recompensas para saber se cada movimento feito pode levar ao sucesso.

Para isso, ela precisa sair de um cubo mágico já resolvido e fazer o passo-a-passo de trás para frente. Essa forma de compreender o desafio não é a mais adequada, mas aí é que entra a rede neural e seus complexos cálculos, que conseguiram preencher lacunas durante esse processo. Depois de treinada dessa forma, a máquina monta então uma árvore de busca com várias sugestões para cada configuração.

cubo mágicoEsquema apresentado na documentação dos cientistas

“Nosso algoritmo é capaz de resolver 100% dos cubos aleatoriamente embaralhados ao mesmo tempo em que obtém uma média de resolução em 30 movimentos — que é menor ou igual ao desempenho dos especialistas humanos”, celebrou McAleer. Foram utilizados dois milhões de diferentes iterações em oito bilhões de cubos em 44 horas de treino em um servidor Intel Xeon E5-2620 de 32 núcleos e três GPUs Nvidia Titan XP.

A novidade traz mais luz ao assunto porque o aprendizado profundo ainda tem lutado bastante para auxiliar a IA a completar sozinha jogos como Sokoban, Montezuma’s Revenge e fatoração de números primos.

E onde isso pode ser aplicado?

Obviamente, o objetivo final não é só criar um sistema que possa superar o cubo mágico. Isso pode ser usado para que uma máquina possa resolver sequências inesperadas em um universo de combinações com uma solução já conhecida. O DeepCube pode “manipular algebricamente conhecimentos previamente adquiridos para responder a uma nova questão”, segundo os pesquisadores.

Ao conquistar esses objetivos, a novidade pode ser aplicada para descobrir novos remédios, realizar análise de DNA e ajudar robôs a decidirem sozinhos algumas situações típicas de nosso cotidiano humano. Aguardemos os próximos passos, pois já há metas para superar cubos mais difíceis, de 16 lados.