La IA más la edición genética prometen acelerar la biotecnología


Durante su conferencia del Premio Nobel de Química en 2018, Frances Arnold dijo: «Hoy podemos, para todos los fines prácticos, leer, escribir y editar cualquier secuencia de ADN, pero no podemos componerla». Eso ya no es cierto.


por Marc Zimmer


Desde entonces, la ciencia y la tecnología han progresado tanto que la inteligencia artificial ha aprendido a componer el ADN, y con bacterias genéticamente modificadas, los científicos están en camino de diseñar y fabricar proteínas a medida.

El objetivo es que con los talentos de diseño de la IA y las capacidades de ingeniería de edición de genes, los científicos puedan modificar las bacterias para que actúen como mini fábricas que produzcan nuevas proteínas que puedan reducir los gases de efecto invernadero, digerir plásticos o actuar como pesticidas específicos de cada especie.

Como profesor de química y químico computacional que estudia ciencia molecular y química ambiental, creo que los avances en inteligencia artificial y edición de genes hacen que esta sea una posibilidad realista.

Secuenciación de genes: lectura de las recetas de la vida

Todos los seres vivos contienen materiales genéticos (ADN y ARN) que proporcionan la información hereditaria necesaria para replicarse y producir proteínas. Las proteínas constituyen el 75% del peso seco humano. Forman músculos, enzimas, hormonas, sangre, cabello y cartílagos. Comprender las proteínas significa comprender gran parte de la biología. El orden de las bases de nucleótidos en el ADN o el ARN en algunos virus codifica esta información, y las tecnologías de secuenciación genómica identifican el orden de estas bases.

El Proyecto Genoma Humano fue un esfuerzo internacional que secuenció todo el genoma humano entre 1990 y 2003. Gracias a la rápida mejora de las tecnologías, se necesitaron siete años para secuenciar el primer 1% del genoma y otros siete años para el 99% restante. En 2003, los científicos tenían la secuencia completa de los 3 mil millones de pares de bases de nucleótidos que codifican entre 20.000 y 25.000 genes en el genoma humano.

Sin embargo, comprender las funciones de la mayoría de las proteínas y corregir sus disfunciones siguió siendo un desafío.

La IA aprende proteínas

La forma de cada proteína es fundamental para su función y está determinada por la secuencia de sus aminoácidos, que a su vez está determinada por la secuencia de nucleótidos del gen. Las proteínas mal plegadas tienen la forma incorrecta y pueden provocar enfermedades como enfermedades neurodegenerativas , fibrosis quística y diabetes tipo 2. Comprender estas enfermedades y desarrollar tratamientos requiere conocimiento de las formas de las proteínas.

Antes de 2016, la única forma de determinar la forma de una proteína era mediante cristalografía de rayos X , una técnica de laboratorio que utiliza la difracción de rayos X por monocristales para determinar la disposición precisa de átomos y moléculas en tres dimensiones en una molécula. En aquel momento, se había determinado mediante cristalografía la estructura de unas 200.000 proteínas, lo que costó miles de millones de dólares.

AlphaFold, un programa de aprendizaje automático, utilizó estas estructuras cristalinas como conjunto de entrenamiento para determinar la forma de las proteínas a partir de sus secuencias de nucleótidos. Y en menos de un año, el programa calculó las estructuras proteicas de los 214 millones de genes que han sido secuenciados y publicados. Todas las estructuras de proteínas determinadas por AlphaFold se han publicado en una base de datos de libre acceso .

Para abordar eficazmente las enfermedades no infecciosas y diseñar nuevos fármacos , los científicos necesitan un conocimiento más detallado de cómo las proteínas, especialmente las enzimas, se unen a las moléculas pequeñas. Las enzimas son catalizadores de proteínas que permiten y regulan reacciones bioquímicas.

https://www.youtube.com/embed/9ufplEgtq8w?color=whiteEl sistema de inteligencia artificial AlphaFold3 permite a los científicos crear modelos intrincadamente detallados de la maquinaria molecular de la vida.

AlphaFold3 , publicado el 8 de mayo de 2024, puede predecir las formas de las proteínas y los lugares donde las moléculas pequeñas pueden unirse a estas proteínas. En el diseño racional de fármacos , los fármacos están diseñados para unirse a proteínas implicadas en una vía relacionada con la enfermedad que se está tratando. Los fármacos de molécula pequeña se unen al sitio de unión de las proteínas y modulan su actividad, influyendo así en la trayectoria de la enfermedad. Al poder predecir los sitios de unión de proteínas, AlphaFold3 mejorará las capacidades de desarrollo de fármacos de los investigadores.

AI + CRISPR = componer nuevas proteínas

Alrededor de 2015, el desarrollo de la tecnología CRISPR revolucionó la edición de genes. CRISPR se puede utilizar para encontrar una parte específica de un gen, cambiarla o eliminarla, hacer que la célula exprese más o menos su producto genético o incluso agregar un gen completamente extraño en su lugar.

En 2020, Jennifer Doudna y Emmanuelle Charpentier recibieron el Premio Nobel de Química «por el desarrollo de un método (CRISPR) para la edición del genoma». Con CRISPR, la edición de genes, que antes tomaba años y era específica para cada especie, costosa y laboriosa, ahora se puede realizar en días y por una fracción del costo.

La IA y la ingeniería genética avanzan rápidamente. Lo que antes era complicado y costoso ahora es rutina. De cara al futuro, el sueño es tener proteínas personalizadas diseñadas y producidas mediante una combinación de aprendizaje automático y bacterias modificadas con CRISPR. La IA diseñaría las proteínas y las bacterias alteradas mediante CRISPR producirían las proteínas. Las enzimas producidas de esta manera podrían potencialmente inhalar dióxido de carbono y metano mientras exhalan materias primas orgánicas, o descomponer los plásticos en sustitutos del hormigón.

Creo que estas ambiciones no son irreales, dado que los organismos genéticamente modificados ya representan el 2% de la economía estadounidense en agricultura y productos farmacéuticos.

Dos grupos han creado enzimas funcionales desde cero que fueron diseñadas mediante diferentes sistemas de inteligencia artificial. El Instituto David Baker para el Diseño de Proteínas de la Universidad de Washington ideó una nueva estrategia de diseño de proteínas basada en el aprendizaje profundo a la que denominó » alucinación familiar «, que utilizaron para crear una enzima emisora ​​de luz única . Mientras tanto, la startup de biotecnología Profluent ha utilizado una IA entrenada a partir de la suma de todos los conocimientos de CRISPR-Cas para diseñar nuevos editores de genoma funcionales .

Si la IA puede aprender a crear nuevos sistemas CRISPR, así como enzimas bioluminiscentes que funcionen y nunca se hayan visto en la Tierra, existe la esperanza de que la combinación de CRISPR con la IA pueda usarse para diseñar otras nuevas enzimas personalizadas. Aunque la combinación CRISPR-IA todavía está en su infancia, una vez que madure es probable que sea muy beneficiosa e incluso podría ayudar al mundo a abordar el cambio climático.

Es importante recordar, sin embargo, que cuanto más poderosa es una tecnología, mayores son los riesgos que plantea. Además, los seres humanos no han tenido mucho éxito en la ingeniería de la naturaleza debido a la complejidad y la interconexión de los sistemas naturales, lo que a menudo conduce a consecuencias no deseadas.

Este artículo se vuelve a publicar desde The Conversation bajo una licencia Creative Commons. Lea el artículo original .