Nova IA da DeepMind, irmã da Google, aprendeu a jogar Go sem ajuda humana

2 min de leitura
Imagem de: Nova IA da DeepMind, irmã da Google, aprendeu a jogar Go sem ajuda humana

A DeepMind, uma empresa focada em inteligência artificial subsidiária da Alphabet — que também é dona da Google —, apresentou hoje (18) através de um artigo publicado na revista Nature a sua nova criação, o AlphaGo Zero. Esse software é basicamente um especialista no jogo chinês “Go” artificialmente inteligente e completamente autodidata.

O Zero não foi alimentado nem treinado com qualquer tipo de dado ou ajuda humana

Diferente do AlphaGo original da DeepMind, que venceu o 18 vezes campeão mundial de Go Lee Se-dol, o AlphaGo Zero não precisou de dados de jogatinas humanas para aprender. O software original precisou ser alimentado com dados de mais de 100 mil partidas de Go para, só então, começar a aprender a através de humanos. O Zero, por sua vez, não foi alimentado nem treinado com qualquer tipo de dado ou ajuda humana.

Tudo o que os programadores fizeram foi construir o algoritmo de Machine Learning com as regras do jogo e deixaram que ele jogasse milhões de vezes consecutivas contra si mesmo em um ambiente virtual. “Ao não usar dados humanos — ao não usar expertise humana de forma alguma — nós conseguimos remover as limitações do conhecimento humano”, disse David Silver, líder do projeto AlphaGo na DeepMind.

Silver comentou que isso abriu uma série de possibilidades para a inteligência artificial que aprendeu a jogar Go sozinha. “Dessa forma, o software se tornou capaz de criar conhecimento por si só através de princípios básicos, a partir de uma folha em branco. Isso permitiu que o Zero fosse muito mais poderoso que versões anteriores”, completou.

O software se tornou capaz de criar conhecimento por si só através de princípios básicos

O engenheiro ainda comentou que o software levou apenas três dias para aprender a jogar Go de uma forma que nenhum humano com milênios de experiências acumuladas passadas de geração em geração consegue. Em sua curva de aprendizado, os criadores perceberam que o Zero foi descobrindo várias estratégias para vencer em Go que humanos já tinham descoberto há séculos. Depois de algum tempo, entretanto, ele inventou um novo padrão e, agora é capaz de vencer virtualmente qualquer jogador, humano ou máquina.

Ao jogar contra o AlphaGo original, treinado com conhecimento humano, o Zero conseguiu vencer as 100 primeiras partidas sem pestanejar. Depois de 40 dias de jogatina, a taxa de vitórias do Zero ficou em cerca de 90% contra seu irmão mais velho.

O mais interessante, entretanto, é a eficiência do software novo. Além de ser melhor que o antigo, ele usa apenas quatro TPUs, núcleos de processamento especializados em IA desenvolvidos pela Google. O AlphaGo original precisa de nada menos que 48 desses.

Você sabia que o TecMundo está no Facebook, Instagram, Telegram, TikTok, Twitter e no Whatsapp? Siga-nos por lá.