'ChatGPT do DNA': IA já projeta vírus funcionais e mira superbactérias
Enquanto o noticiário de tecnologia gasta tinta com a novela Musk x Altman, um modelo de inteligência artificial criado para "ler e escrever" DNA acaba de virar publicação na revista Nature. O Evo 2, do Arc Institute em parceria com a Nvidia, completou um ano e o saldo é menos hype e mais resultado: ele projetou vírus do zero, e os vírus funcionaram em testes de laboratório.
O que aconteceu
O Evo 2 é, para o DNA, mais ou menos o que o ChatGPT é para o texto. O modelo foi treinado com material extraído do genoma de mais de 128 mil espécies, de bactérias a humanos.
Lançado em fevereiro de 2025, ele passou um ano sob revisão científica e acaba de ser publicado oficialmente na Nature, a revista mais prestigiada do mundo na área.
A grande sacada: além de identificar trechos de DNA ligados a doenças, ele consegue gerar novas sequências genéticas plausíveis — escrever código biológico inédito, como o ChatGPT que produz textos que fazem sentido.
O time já mostrou que isso não é só promessa de slide. Usando o Evo 2, pesquisadores desenharam 285 versões de um vírus que ataca bactérias. Dezesseis delas funcionaram em laboratório, infectando exatamente as cepas-alvo, sem mexer em outras. É um marco para o uso de IA generativa em biologia: a sequência saiu do modelo e funcionou na placa de Petri.
A aplicação imediata mais óbvia é tratar bactérias resistentes a antibióticos — um problema de saúde pública que já mata mais gente no mundo do que HIV ou malária.
Em humanos, um estudo aplicou o modelo a pacientes com Alzheimer e os "palpites" do Evo 2 sobre o gene mais associado à doença bateram com o risco real medido em pacientes. Outro grupo testou em animais de pecuária e teve bom desempenho ao identificar mutações relevantes para melhoramento genético.
Outra equipe de pesquisadores conseguiu comprimir o modelo numa versão 500 vezes mais leve, que roda em hardware menos sofisticado — abrindo caminho para o uso em laboratórios sem supercomputador.
Surpresa de bastidores: o Evo 2 demonstrou um truque até então atribuído quase só a modelos de linguagem como o ChatGPT — aprender de bate-pronto, só com exemplos dados na hora. Sugere que esse tipo de "inteligência emergente" não é exclusivo da linguagem humana e aparece também quando se ensina máquina a ler DNA em escala.
Tudo é aberto: código, pesos do modelo e dados de treino estão disponíveis para qualquer pesquisador baixar. É uma escolha que contrasta com a de OpenAI e Anthropic, por exemplo, que mantêm seus modelos fechados.
Por questão de segurança, o time deliberadamente excluiu do treinamento vírus que infectam humanos. Os autores reconhecem que a próxima geração desses modelos vai exigir freios mais robustos.
IAgora?
Enquanto o debate sobre IA generativa está preso em discussões sobre bolha, retorno financeiro duvidoso e produtividade que não aparece nos balanços, na biologia a tecnologia começa a entregar resultados concretos e verificáveis em laboratório.
O Evo 2 é a prova de que o setor não está só inflando expectativa — em alguns nichos, está sim mudando como o trabalho é feito.
Para o leitor que se pergunta "tudo bem, mas o que isso muda na minha vida?", imagine um cenário em que será possível "escrever" trechos inteiros de DNA sob medida — para terapia, agricultura ou pesquisa.
No futuro, isso pode significar diagnósticos mais rápidos e baratos, terapias contra superbactérias e até plantio resistente a estresse climático. Os autores chamam isso de ciclo "ler-escrever-pensar" da biologia. Parece otimista, mas é o que o trabalho deles começa a viabilizar.
Há também o lado incômodo. O mesmo modelo aberto que pode ajudar a curar doença pode, em tese, ser desviado por alguém com intenções ruins.
O Arc Institute tomou cuidados — excluiu vírus que afetam humanos do treino, fez testes de estresse com pesquisadores tentando "quebrar" o modelo —, mas reconhece que essas barreiras vão precisar ser reforçadas conforme a tecnologia avança.
A discussão regulatória sobre IA hoje, no Brasil e no mundo, está quase toda focada em deepfake, eleição, direitos autorais... e quem olha para o que está saindo dos laboratórios de biologia computacional? Vale ficar de olho.
Reportagem
Texto que relata acontecimentos, baseado em fatos e dados observados ou verificados diretamente pelo jornalista ou obtidos pelo acesso a fontes jornalísticas reconhecidas e confiáveis.