Nova IA da DeepMind, irmã da Google, aprendeu a jogar Go sem ajuda humana

Software recebeu apenas as regras do jogo e desenvolveu estratégias inéditas

Leonardo Muller

schedule18/10/2017, às 16:17

Fonte:

Imagem de Nova IA da DeepMind, irmã da Google, aprendeu a jogar Go sem ajuda humana no tecmundo

A DeepMind, uma empresa focada em inteligência artificial subsidiária da Alphabet — que também é dona da Google —, apresentou hoje (18) através de um artigo publicado na revista Nature a sua nova criação, o AlphaGo Zero. Esse software é basicamente um especialista no jogo chinês “Go” artificialmente inteligente e completamente autodidata.

O Zero não foi alimentado nem treinado com qualquer tipo de dado ou ajuda humana

smart_display

Nossos vídeos em destaque

Diferente do AlphaGo original da DeepMind, que venceu o 18 vezes campeão mundial de Go Lee Se-dol, o AlphaGo Zero não precisou de dados de jogatinas humanas para aprender. O software original precisou ser alimentado com dados de mais de 100 mil partidas de Go para, só então, começar a aprender a através de humanos. O Zero, por sua vez, não foi alimentado nem treinado com qualquer tipo de dado ou ajuda humana.

Tudo o que os programadores fizeram foi construir o algoritmo de Machine Learning com as regras do jogo e deixaram que ele jogasse milhões de vezes consecutivas contra si mesmo em um ambiente virtual. “Ao não usar dados humanos — ao não usar expertise humana de forma alguma — nós conseguimos remover as limitações do conhecimento humano”, disse David Silver, líder do projeto AlphaGo na DeepMind.

Silver comentou que isso abriu uma série de possibilidades para a inteligência artificial que aprendeu a jogar Go sozinha. “Dessa forma, o software se tornou capaz de criar conhecimento por si só através de princípios básicos, a partir de uma folha em branco. Isso permitiu que o Zero fosse muito mais poderoso que versões anteriores”, completou.

O software se tornou capaz de criar conhecimento por si só através de princípios básicos

O engenheiro ainda comentou que o software levou apenas três dias para aprender a jogar Go de uma forma que nenhum humano com milênios de experiências acumuladas passadas de geração em geração consegue. Em sua curva de aprendizado, os criadores perceberam que o Zero foi descobrindo várias estratégias para vencer em Go que humanos já tinham descoberto há séculos. Depois de algum tempo, entretanto, ele inventou um novo padrão e, agora é capaz de vencer virtualmente qualquer jogador, humano ou máquina.