Tornar os produtos que consumimos mais sustentáveis é algo que o mundo precisa desesperadamente. E para a fabricação de produtos químicos do dia-a-dia, a solução pode estar nas enzimas – as minúsculas máquinas moleculares que aceleram as reações químicas que mantêm quase todos os organismos vivos, além de catalisar muitos processos de fabricação. No entanto, sua ampla adoção para uso industrial é atualmente impedida pela dificuldade de escolher a enzima adequada para a reação química certa.
Para resolver esse quebra-cabeça de combinação, um modelo de aprendizado de máquina (Machine Learning) foi construído para ajudar os cientistas a prever quais enzimas podem ser substitutas adequadas para uma determinada reação. Isso permitiria uma abordagem de processos mais sustentáveis e seguros, aproveitando catalisadores biológicos que foram otimizados pelo processo evolutivo da natureza em 3,5 milhões de anos.
As enzimas são os principais aceleradores da maioria dos processos no corpo humano, desempenhando um papel crítico em tudo, desde a digestão até a quebra de toxinas nocivas e a replicação do DNA. A importância das enzimas vai além da bioquímica; elas também são usadas para tornar os processos químicos industriais mais sustentáveis, reduzindo o consumo de energia ou a quantidade de solventes necessários para sua preparação.
Ao fazer papel branco para impressão ou uso em cadernos por exemplo, a enzima xilanase ajuda a reduzir a quantidade de alvejante de cloro e, ao assar, as enzimas proteases ajudam os biscoitos a se desfazerem ao quebrar o glúten da farinha de trigo. Mas ainda não existem muitas aplicações industriais em que as enzimas sejam amplamente adotadas, porque escolher as certas é uma tarefa difícil. Muitas vezes requer uma grande quantidade de conhecimento específico que nenhum químico ou equipe de químicos poderia entender completamente.
É aqui que entra em jogo o novo modelo de IA1 orientada por dados da IBM para planejamento de síntese biocatalisada. O modelo é treinado em dados USPTO publicamente disponíveis sobre biocatálise enzimática que, em princípio, elimina a necessidade de um ser humano ser um especialista em biocatálise para selecionar a enzima e o substrato necessários para obter uma substância química desejada. Ao fazer isso, o modelo fecha uma lacuna de conhecimento que muitas vezes impede que reações mais sustentáveis sejam usadas na indústria.
A construção e o treinamento do modelo IBM aproveitou o aprendizado de transferência multitarefa, pelo qual o modelo aprende com um banco de dados de reações biocatalisadas e um banco de dados maior contendo todos os tipos de reações químicas. Multitarefa seria como aprender a tocar guitarra e baixo ao mesmo tempo. E no contexto da química, isso significa que o modelo é treinado simultaneamente nos conjuntos de dados gerais e específicos da reação enzimática, em vez de sequencialmente.
Acelerar a descoberta de novos materiais está no centro dos esforços da IBM para ajudar a inventar o que está por vir em ciência e engenharia. É o tipo de trabalho que está sendo feito com o RoboRXN, uma plataforma baseada em nuvem, orientada por dados e alimentada por IA para automação de síntese química. Com o novo modelo de aprendizado de máquina (Machine Learning), os recursos do RoboRXN estão sendo expandidos para incluir uma nova ferramenta que facilita o uso de enzimas para uma química mais ecológica.
O modelo treinado, bem como o código, estão disponíveis publicamente para qualquer pessoa usar. A IBM espera que os químicos os usem em seus projetos de pesquisa?Você pode baixar o código de pesquisa de enzimas no GitHub ou iniciar um projeto com um modelo treinado no RXN for Chemistry.