IA da Uber bate recorde e é a primeira a dominar jogos clássicos de Atari

1 min de leitura
Imagem de: IA da Uber bate recorde e é a primeira a dominar jogos clássicos de Atari

Pela primeira vez na história, uma inteligência artificial (IA) foi capaz de concluir todas as três variações de fases do jogo “Montezuma’s Revenge”, lançado para o Atari 2600 em 1984. Quem conseguiu esse feito foi o Go-Explore, nome dado a um conjunto de algoritmos desenvolvidos por pesquisadores da Uber.

Obter uma boa pontuação nesse jogo é considerado como um grande marco para empresas da área, com organizações como a DeepMind e a OpenAI já tendo criado programas capazes de marcar alguns pontos. No entanto, essas versões precisavam assistir a um jogador humano para aprender como o game funciona antes de darem início às suas tentativas.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Isso não acontece no caso de Go-Explore, que compreende o objetivo de “Montezuma’s Revenge” sem precisar ver alguém jogando antes. Esse é um acontecimento digno de destaque porque a “recompensa” (passar de fase) não é algo fácil de ser entendido por uma máquina, sendo necessário coletar itens, derrotar inimigos e desbloquear sessões específicas da área para conseguir os melhores números.

Em todos os casos, as inteligências artificiais concorrentes ficavam na média dos 11 mil pontos, com o recorde anterior delas sendo de 17 mil pontos. Go-Explore, por sua vez, chegou a marcar 2 milhões de pontos, alcançando o nível 159 do jogo. Ela também se destacou ao jogar “Pitfall!”, fazendo 21 mil pontos em um jogo no qual nenhuma IA tinha conseguido pontuar até então.

Esse também é um exemplo de jogo complicado para as máquinas, pois a recompensa depende da coleta de itens e não simplesmente de avançar pelo maior número de telas possível sem morrer. Para que a Go-Explore aprendesse isso, ela jogou diversas vezes até entender quais ações resultavam em uma pontuação maior e quais não eram revertidas em pontos.

Para os pesquisadores, esses resultados são promissores e devem ser utilizados principalmente na robótica. A partir dele, é possível que máquinas testem diversas soluções antes de decidir qual é a melhor e executar apenas essa. Você pode ver uma versão inicial do artigo com os resultados da pesquisa no site da Uber.

smart people are cooler

Tecnologia, negócios e comportamento sob um olhar crítico.

Assine já o The BRIEF, a newsletter diária que te deixa por dentro de tudo

Fontes

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.