Un dulce logro: Descubren los misterios del genoma de la caña de azúcar


Durante siglos la caña de azúcar ha suministrado a las sociedades humanas alcohol, biocombustibles, materiales de construcción y tejido, y la fuente de azúcar más confiable del mundo. Ahora, los investigadores han extraído un dulce premio científico de la caña de azúcar: su masiva y compleja secuencia del genoma, lo cual puede llevar al desarrollo de cultivares más resistentes y productivos.


La producción de la compleja secuencia requirió un esfuerzo concertado por parte de más de 100 científicos de 16 instituciones; el trabajo tomó cinco años y culminó en una publicación en Nature Genetics. Pero la motivación para abordar el proyecto surgió mucho antes.

“Personalmente, esperé durante 20 años para obtener la secuenciación de este genoma”, dijo Ray Ming, un profesor de biología vegetal de la Universidad de Illinois que instigó y dirigió el esfuerzo de secuenciación. “Soñé con tener un genoma de referencia para la caña de azúcar cuando trabajé en el mapeo del genoma de la caña a fines de la década de 1990”. Ming es miembro del Instituto Carl R. Woese de Biología Genómica, uno de un grupo de investigadores interesados ​​en desarrollar caña de azúcar y cultivos relacionados para aumentar la producción de alimentos y biocombustibles.

Valió la pena la espera y el esfuerzo de obtener la secuencia completa del genoma debido a su potencial para ayudar a mejorar este cultivo. La caña de azúcar producida por la mayoría de los agricultores es un híbrido de dos especies: Saccharum officinarum, que crece plantas grandes con alto contenido de azúcar, y Saccharum espontaneum, cuyo menor tamaño y dulzura se compensa con el aumento de la resistencia a las enfermedades y la tolerancia al estrés ambiental. Al carecer de una secuencia completa del genoma, los fitomejoradores han desarrollado cepas robustas y de alto rendimiento a través de generaciones de cruzamiento y selección, pero este es un proceso arduo que depende del tiempo y la suerte.

“La caña de azúcar es el quinto cultivo más valioso, y la falta de un genoma de referencia obstaculizó la investigación genómica y el breeding molecular para mejorar la caña de azúcar”, dijo Ming”. La tecnología de secuenciación no estaba lista para manejar grandes genomas autopoliploides (cuando un ancestro duplicó sus propios genes) hasta 2015, momento en que el rendimiento, la longitud de lectura y el costo de la tecnología de secuenciación de tercera generación [por ejemplo, la desarrollada por la compañía de biotecnología Pacific Biosciences] se volvió lo suficientemente competitiva”.

¿Por qué era tan difícil secuenciar el genoma de la caña de azúcar? Un fenómeno natural común en las plantas creó una importante barrera técnica. En algún momento durante la historia evolutiva de la caña de azúcar, su genoma se había duplicado dos veces, lo que daba como resultado cuatro versiones ligeramente diferentes de cada par de cromosomas, todos juntos en el mismo núcleo.

Estos eventos no solo cuadruplicaron el tamaño del genoma (y, por lo tanto, el gran volumen de la secuencia de ADN), también hicieron que las secuencias altamente similares de la amplia duplicación del genoma fueran mucho más difíciles de ensamblar en distintos cromosomas. El ADN genómico se suele secuenciar, o leer, en pequeños fragmentos superpuestos, y los datos de la secuencia de esos fragmentos se convierten en piezas superpuestas de un enorme rompecabezas lineal. A medida que el tamaño del genoma de la caña de azúcar se duplicó en algún ancestro, y luego se duplicó nuevamente, este rompecabezas no solo se hizo más grande; también adoptó elementos repetidos pero no muy idénticos en los que era difícil encajar correctamente esas muchas piezas diminutas.

Para superar este desafío, el equipo de secuenciación utilizó una técnica llamada captura de conformación de cromatina de alto rendimiento o Hi-C. Este método permite a los investigadores descubrir qué partes de las hebras largas y enmarañadas del ADN cromosómico se encuentran en contacto entre sí dentro de la célula. Cuando se analizaron utilizando un algoritmo personalizado llamado ALLHIC desarrollado por el equipo, los datos resultantes sirvieron para el propósito de la imagen en la tapa de una caja de rompecabezas, proporcionando un mapa aproximado de las secciones de la secuencia que con mayor probabilidad pertenecían a cada cromosoma.

“La mayor sorpresa fue que mediante la combinación de lecturas de secuencias largas y el mapa físico de Hi-C, reunimos un genoma autotetraploide [cuadruplicado] en 32 cromosomas y nos dimos cuenta de nuestro objetivo de anotación específica de alelo entre cromosomas homólogos”, dijo Ming. En otras palabras, los investigadores ahora sabían qué secuencias de genes pertenecían a cada una de las cuatro variaciones en el genoma original, antes de la duplicación, un nivel de detalle mucho mayor del que esperaban alcanzar.

Con esta información, los investigadores podrían formular mejores hipótesis sobre los misterios de la historia evolutiva del genoma de la caña de azúcar.

A través de la comparación con los genomas de especies relacionadas, los investigadores sabían que en algún momento el número de cromosomas únicos había disminuido de 10 a ocho. Para sorpresa del equipo, los nuevos datos de la secuencia revelaron que dos cromosomas diferentes se habían dividido, y las cuatro mitades se habían fusionado con diferentes cromosomas existentes, un conjunto de eventos más complejo que el que suponían.

¿Cómo ayuda la comprensión de estos cambios físicos? Junto con estos grandes reordenamientos físicos dentro del genoma, vienen cambios en los genes en las regiones afectadas. Por ejemplo, Ming y sus colegas descubrieron que los grandes fragmentos de cromosoma que se habían trasladado a nuevas ubicaciones contenían muchos más genes que ayudan a las plantas a resistir las enfermedades que las que se encontraron en otras ubicaciones.

“Se resolvió el misterio de por qué S. spontaneum es una fuente tan superior de genes de resistencia a enfermedades y tolerancia al estrés”, dijo Ming. “Los reordenamientos cromosómicos son probablemente la causa, no la consecuencia de este enriquecimiento, aunque el mecanismo subyacente de este enriquecimiento aún debe investigarse. Este descubrimiento acelerará la extracción de alelos eficaces de genes de resistencia a enfermedades que se han incorporado a los cultivares híbridos de caña de azúcar modernos de élite, y posteriormente el implemento de mejoramiento molecular [de caña de azúcar] “.

La alta calidad de la secuencia del genoma también permitió a los investigadores identificar posibles orígenes de la increíble dulzura de la caña de azúcar moderna: incluso en el menos dulce S. spontaneum, se han acumulado mutaciones que produjeron múltiples copias de genes para proteínas transportadoras de azúcar. También pudieron observar que en la hibridación entre S. officinarum y S. spontaneum, la secuencia de ADN derivada de S. spontaneum se dispersa aleatoriamente por todo el genoma híbrido.

“El método ALLHIC ya ha demostrado ser efectivo para la construcción del genoma de la caña de azúcar autopoliploide”, dijo Ming. Él anticipa que las técnicas utilizadas con éxito para el genoma de la caña de azúcar también ayudarán a los investigadores a secuenciar otros genomas complejos.