Redes complejas identifican genes para cultivos de biocombustibles


Departamento de Energía de los Estados Unidos.

Para mejorar la producción de biocombustibles, los científicos deben comprender las interacciones fundamentales que conducen a la expresión de rasgos clave en plantas y microbios. 


Para comprender estas interacciones, los científicos están utilizando diferentes capas de información (sobre las relaciones entre los genes y entre los genes y los fenotipos) combinados con nuevos enfoques computacionales para integrar vastas cantidades de datos en un marco de modelado. Los investigadores ahora pueden identificar genes que controlan rasgos importantes para atacar la producción de biocombustibles y biocombustibles. El algoritmo utilizado en este trabajo se ha utilizado para romper la barrera de escala de supercomputación por primera vez en cualquier parte del mundo.

Este enfoque permite a los científicos analizar conjuntos de datos masivos. Pueden hacerlo utilizando la computación exescala, donde las computadoras realizan 10 18 cálculos por segundo. Con este enfoque, los científicos pueden entender cómo funcionan las células. Pueden usar los conocimientos para obtener características beneficiosas de bioingeniería en plantas y microbios. La capacidad de utilizar la computación a gran escala abre posibilidades para estudiar procesos moleculares altamente complejos e interrelacionados en células a un nivel de detalle que antes no era posible. Tal computación también anuncia una nueva era para la biología de sistemas.

Los organismos biológicos son sistemas complejos compuestos de redes funcionales de moléculas interactivas y macromoléculas. Los rasgos complejos (fenotipos) dentro de los organismos son el resultado de colecciones orquestadas, jerárquicas y heterogéneas de genes expresados. Sin embargo, los efectos de estos genes y las variantes genéticas son el resultado de la presión selectiva histórica y las señales ambientales y epigenéticas actuales, y, como tal, su co-ocurrencia puede verse como correlaciones de todo el genoma de diferentes maneras. El recalcitrance de la biomasa (es decir, la resistencia de las plantas a la degradación o deconstrucción, que en última instancia permite el acceso a los azúcares de una planta con fines bioenergéticos) es un rasgo multigénico complejo de gran importancia para las iniciativas de biocombustibles.

Para comprender mejor las interacciones moleculares involucradas en el recalcitrance e identificar los genes diana involucrados en la biosíntesis / degradación de la lignina, este estudio utiliza datos derivados de los genomas re-secuenciados de más de 800 genotipos diferentes de Populus trichocarpa en combinación con datos metabolómicos (las concentraciones Metabolitos) y datos de espectrometría de masas por haz molecular de pirólisis. Además, los científicos utilizaron otras formas de regulación génica, incluidas la coexpresión, la co-metilación y las redes de coevolución.

Al analizar estos datos, un equipo desarrolló un sistema de puntuación de «líneas de evidencia» (LOE, por sus siglas en inglés) para integrar la información en las diferentes capas y cuantificar el número de LOE que unen genes con funciones objetivo. Aplicaron este nuevo sistema de puntuación para cuantificar las LOE que vinculan los genes a los genes y fenotipos relacionados con la lignina en las capas de la red. La aplicación del sistema de puntuación permitió la generación de nuevas hipótesis para los nuevos genes candidatos involucrados en la biosíntesis de lignina en P. trichocarpa, incluidos varios genes AGAMOUS-LIKE (un tipo de factor de transcripción que controla la expresión de otros genes). Las redes resultantes del estudio Genome Wide Association Study están demostrando ser un enfoque poderoso para determinar el pleiotrópico (genes que afectan a múltiples fenotipos) y epistático (múltiples genesque trabajan juntos para afectar un único fenotipo) relaciones que subyacen a las funciones celulares y, como tales, las bases moleculares para fenotipos complejos, como la recalcitación.

El algoritmo en el software CoMet, que crea la red de coevolución utilizada en este estudio, se ha trasladado a la nueva supercomputadora Summit, la supercomputadora más rápida e inteligente del mundo en la instalación de computación de liderazgo de Oak Ridge. El equipo de investigación utilizó el software CoMet para romper la barrera de las escalas, logrando un rendimiento máximo de 1.88 exaops, más rápido que cualquier otra aplicación de ciencia informada anteriormente, mientras analizaba datos genómicos en la supercomputadora Summit. El equipo de investigación logró la hazaña, equivalente a realizar cerca de 2 mil millones de millones de cálculos por segundo, mediante el uso de una mezcla de precisiones numéricas en una nueva tecnología de chip de computadora de unidad de procesamiento gráfico NVIDIA llamada tensor cores. En este caso, los investigadores implementaron un nuevo enfoque que utilizaba los núcleos tensoriales para obtener un aumento dramático en el rendimiento.

Más información: Deborah Weighill et al. Descubrimiento basado en redes pleistópicas y epistáticas: redes integradas para el descubrimiento de genes objetivo, fronteras en la investigación de energía (2018). DOI: 10.3389 / fenrg.2018.00030 

Proporcionado por: US Department of Energy

FUENTE: phys.org