DeepMind vai liberar estruturas de todas as proteínas conhecidas

3 min de leitura
Imagem de: DeepMind vai liberar estruturas de todas as proteínas conhecidas
Imagem: Fonte: DeepMind/Reprodução.
Avatar do autor

Em dezembro de 2020, a DeepMind, braço de inteligência artificial do Google, pegou o mundo da biologia de surpresa ao resolver um grande desafio de 50 anos com o AlphaFold — uma ferramenta de IA que pode prever a estrutura de proteínas. Na semana passada, a empresa com sede em Londres publicou todos os detalhes da ferramenta e liberou seu código-fonte.

Imagem de proteína enovelada em 3D.Imagem de proteína enovelada em 3D.Fonte:  DeepMind 

Agora, a empresa anunciou que usou sua IA para prever as formas de quase todas as proteínas do corpo humano, além das formas de centenas de milhares de outras proteínas encontradas em 20 dos organismos mais amplamente estudados pela ciência, incluindo leveduras, moscas-das-frutas e ratos. A descoberta pode permitir que biólogos de todo o mundo entendam melhor as doenças e desenvolvam novos medicamentos.

Até agora, o banco de dados consiste em 350.000 novas estruturas de proteínas. A DeepMind diz que vai prever e liberar as estruturas de mais de 100 milhões delas nos próximos meses — mais ou menos todas as proteínas conhecidas pela ciência.

“O enovelamento de proteínas é um problema no qual estou de olho há mais de 20 anos”, disse o cofundador e CEO da DeepMind, Demis Hassabis, em entrevista à MIT Technology Review. “Tem sido um grande projeto para nós. Eu diria que esta é a maior coisa que fizemos até agora. E é o mais empolgante de certa forma, porque deve ter o maior impacto no mundo fora da inteligência artificial”, completou Hassabis.

Estrutura das proteínas revelada

Proteínas são feitas de longas fitas de aminoácidos, que se contorcem em nós complicados. Saber a forma do nó de uma proteína pode revelar o que ela faz. O acesso a esse enovelamento é crucial para entender como as doenças funcionam e desenvolver novos medicamentos — ou até mesmo descobrir novas maneiras de ajudar o planeta, por exemplo, identificando organismos que podem ajudar a combater a poluição e as mudanças climáticas.

Mas descobrir a forma de uma proteína leva semanas ou meses no laboratório. Já com o  AlphaFold, é possível prever essas formas em um ou dois dias. E o novo banco de dados deve facilitar ainda mais a vida dos cientistas.

Repercussão na comunidade científica

Quando o AlphaFold foi anunciado, cientistas disseram à revista Nature que a inteligência artificial "mudaria tudo". Agora, os impactos já podem ser sentidos. David Baker, do Instituto de Design de Proteínas da Universidade de Washington, construiu sua própria ferramenta para prever a estrutura de proteínas — chamado RoseTTAFold, com base na abordagem de AlphaFold.

Nos últimos meses, sua equipe tem trabalhado com biólogos que estavam tentando descobrir — sem sucesso — a forma das proteínas que estavam estudando. “Há muitas pesquisas biológicas muito legais que foram realmente aceleradas”, disse ele à MIT Technology Review. Um banco de dados público, contendo centenas de milhares de formas de proteínas prontas, deve ser um acelerador ainda maior.

“Parece surpreendentemente impressionante”, disse Tom Ellis, biólogo do Imperial College de Londres que estuda o genoma da levedura. Ele afirmou ao site estar animado para experimentar o banco de dados, mas advertiu que a maioria das formas previstas pela IA ainda não foram verificadas em laboratório.

Precisão atômica

A nova versão do AlphaFold traz previsões com uma pontuação de confiança — sinalizando o quão perto cada forma prevista está da real. Até agora, a IA previu formas para 36% das proteínas humanas com uma precisão que é correta até o nível de átomos individuais — bom o suficiente para o desenvolvimento de medicamentos, afirmou Hassabis.

Antes, mesmo após décadas de trabalho, apenas 17% das proteínas do corpo humano tinham suas estruturas identificadas em laboratório. Caso as previsões da AlphaFold sejam tão precisas quanto a DeepMind afirma, a ferramenta mais que dobrou o número de proteínas identificadas em apenas algumas semanas.

Por enquanto, a DeepMind está liberando as ferramentas e previsões gratuitamente e, até o momento, não revelou se tem planos de ganhar dinheiro com elas no futuro. Mas a possibilidade não está descartada.