Inteligencia Artificial para el fitomejoramiento en un clima en constante cambio


¿Cómo podría afectar la inteligencia artificial (IA) a la agricultura, la industria alimentaria y el campo de la bioingeniería? Dan Jacobson, miembro del personal de investigación y desarrollo de la División de Biociencias del Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía de EE. UU. (DOE), tiene algunas ideas.


por Rachel Harken, Laboratorio Nacional de Oak Ridge


Durante los últimos 5 años, Jacobson y su equipo han estudiado plantas para comprender las variables genéticas y los patrones que las hacen adaptables a ambientes y climas cambiantes. Como biólogo computacional, Jacobson utiliza algunas de las supercomputadoras más poderosas del mundo para su trabajo, incluida la recientemente desmantelada Cray XK7 Titan y la supercomputadora más poderosa e inteligente del mundo para ciencia abierta, la supercomputadora IBM AC922 Summit, ambas ubicadas en Oak Ridge Leadership Computing Facility (OLCF), una instalación para usuarios de la Oficina de Ciencias del DOE en ORNL.

El año pasado, Jacobson y su equipo ganaron el premio Gordon Bell de la Asociación de Maquinaria Informática después de utilizar una técnica informática especial conocida como «precisión mixta» en Summit para convertirse en el primer grupo en alcanzar una velocidad de exaescala, aproximadamente un quintillón de cálculos por segundo.

El equipo de Jacobson está trabajando actualmente en numerosos proyectos que forman una hoja de ruta integrada para el futuro de la IA en el fitomejoramiento y la bioenergía. El trabajo del equipo se presentó en Trends in Biotechnology en octubre.

En esta sesión de preguntas y respuestas, Jacobson habla sobre el trabajo de su equipo en un algoritmo de selección genómica, su visión del futuro de la genómica ambiental y el espacio donde la simulación se encuentra con la IA.

¿En qué ha estado trabajando su equipo durante el último año?

Jacobson: Hemos estado trabajando en un par de cosas. Recientemente, hemos desarrollado nuevas formas de hacer lo que se llama «selección genómica», o diseñar un organismo con fines de reproducción. Hemos desarrollado un nuevo algoritmo de selección genómica que se basa en métodos de aprendizaje automático emergentes llamados colectivamente «IA explicable», que es un campo que mejora los métodos de IA de clasificación de caja negra al intentar comprender cómo estos algoritmos toman decisiones.

Este algoritmo nos ayuda a determinar qué variaciones en un genoma necesitamos combinar para producir plantas que puedan adaptarse a sus entornos. Esto informa los esfuerzos de reproducción, los esfuerzos de edición de genes o combinaciones de ellos, según el tipo de estrategia de bioingeniería que desee tomar.

El año pasado ganó un Premio Gordon Bell después de romper la barrera de la exaescala con un código que le permite estudiar las interacciones combinatorias entre los organismos y sus entornos. ¿Cómo encaja este algoritmo en esa investigación?

Jacobson: Todavía estamos usando el modelo que usamos el año pasado, pero ahora, hemos introducido este algoritmo de selección genómica impulsado por IA en nuestro código Combinatorial Metrics [CoMet] y lo estamos alimentando con información ambiental todos los días del año. , por lo que podemos hacer estudios de asociación de todo el genoma a lo largo del tiempo climático.

Además, hemos expandido a una escala global nuestros esfuerzos en lo que llamamos «climatipos»: la información climática y ambiental a la que se están adaptando las plantas. Con la ayuda de Peter Thornton de ORNL y la experiencia de su grupo en biogeografía y clima, construimos modelos de cada kilómetro cuadrado de tierra en el planeta y codificamos 50 años de datos ambientales y climáticos en estos modelos, que van desde el suelo hasta espectros de luz. calidad y todo lo demás.

Para comprender todas las relaciones entre diferentes entornos, comparamos estos entornos entre sí en Summit utilizando un nuevo algoritmo llamado Duo que agregamos a nuestra base de código CoMet. Hasta donde sabemos, este es el cálculo científico más grande jamás realizado.

Eso suena como un logro bastante fuerte. ¿Qué tipo de información pueden brindarte estas comparaciones?

Jacobson: Estas comparaciones pueden ayudarnos a determinar exactamente dónde podemos dirigirnos a ciertos entornos y qué mutaciones genéticas y alelos debemos incluir para ayudar a estas plantas a adaptarse a diferentes entornos. Podemos observar un entorno y decir: «Para este entorno, esto es lo que vamos a necesitar en el genoma de esta planta para que prospere lo mejor posible».

¿Es este el futuro de la genómica ambiental?

Jacobson: La visión integrada que vemos es la conexión de todas las capas «ómicas», desde la genómica ( expresión génica ), la proteómica (expresión de proteínas) y la metabolómica (expresión de metabolitos) hasta los fenotipos: rasgos observables; entonces, del genoma al fenoma y todo lo demás.

Idealmente, nos gustaría tener una combinación de datos de genotipo con datos climáticos y ambientales en un modelo integrado, desde nucleótidos individuales, las estructuras moleculares que componen el ADN, hasta el medio ambiente y el clima a escala planetaria. Estos modelos integrales integrados ahora son posibles porque en realidad hemos calculado la escala espectral de luz de cada punto del planeta; ese es un fenotipo astrofísico que proviene de nuestra estrella más cercana, el Sol.

Primero, debemos observar las interacciones combinatorias en dichos modelos para ver cómo conducen a las propiedades emergentes que estamos tratando de optimizar en las plantas para la productividad y sustentabilidad futuras. Luego, podemos conectar eso con la forma en que las plantas se han adaptado históricamente a los entornos para diseñar nuevos genotipos ideales para la bioenergía o la producción de alimentos que están optimizados para prosperar en entornos específicos.

¿Es esto algo que se requerirá en la agricultura en el futuro?

Jacobson: A medida que el mundo cambia, existe una presión cada vez mayor para utilizar «tierras marginales», es decir, tierras que a menudo no se usan actualmente para la agricultura o que no se usan de manera eficiente para la agricultura. Entonces, si diseñamos genotipos que prosperen en estos ambientes marginales, podremos aumentar nuestra producción de alimentos además de nuestra producción de energía. Esta es una tecnología de doble uso.

También nos preocupa mucho la fertilización excesiva de la tierra porque puede provocar escorrentías que tienen grandes consecuencias ecológicas. Si podemos optimizar las plantas para que usen los nutrientes que están allí con poco fertilizante adicional, eso también es un gran beneficio para la sostenibilidad. Entonces, realmente estamos tratando de ver esto de manera integral y construir la mayor cantidad posible de estas adaptaciones en el modelo para conocer los efectos en ciertos entornos.

¿En qué estás trabajando a continuación?

Jacobson: El siguiente paso es observar los datos históricos y todas estas relaciones y luego proyectar hacia adelante para que podamos diseñar genotipos que no solo prosperarán en las zonas ambientales actuales, sino que continuarán prosperando en el futuro a medida que cambia la red global. La capacidad de proyección hacia adelante, tanto para cultivos anuales como para cultivos perennes a largo plazo, es realmente importante.

¿Cuáles son algunos desafíos pendientes?

Jacobson: Todo lo que estamos haciendo es un trabajo pesado, pero estamos viendo cómo podemos diseñar este nuevo enfoque en Summit y el futuro sistema de exaescala de OLCF, Frontier, para que podamos entender realmente todas estas relaciones. Además, ahora que tenemos estos datos en todas estas capas «ómicas», tenemos que ejecutar estas combinaciones de capas, llamadas politopos, miles o decenas de miles o cientos de miles de veces. El próximo conjunto de algoritmos que estamos construyendo es encontrar todas las relaciones y asociaciones posibles dentro y entre todos los politopos. Esa es la próxima frontera.

¿Se cruzará su trabajo con los modelos tradicionales de simulación climática?

Jacobson: Esta es una vista de la información climática basada en datos e inteligencia artificial, que es diferente de un enfoque de simulación. Con el tiempo, será interesante ver dónde se cruzan, y puede haber cosas que aprendamos aquí que sean muy informativas para los modelos climáticos y viceversa. También sabemos que este mismo tipo de tecnología de IA explicable puede ayudar mucho con los estudios de simulación. Idealmente, podríamos desarrollar modelos explicables impulsados ​​por IA que puedan ayudar a los modelos de simulación con algunos de sus cuellos de botella. Si podemos aprender los patrones que usan los modelos de simulación y reemplazar algunos de sus cuellos de botella con un resultado aprendido, entonces esos modelos pueden hacer cosas más creativas. Ahí es realmente donde podríamos ver que parte de este espacio se cruce en el futuro.