Secuencia comercial más completa del genoma de la caña de azúcar ensamblada



Un grupo internacional de investigadores dirigido por científicos brasileños ha reunido la secuencia genómica más completa de la caña de azúcar comercial. Mapearon 373,869 genes o el 99.1 por ciento del genoma total.


por André Julião, FAPESP


Esta hazaña es el resultado de casi 20 años de investigación, y servirá como base para la mejora genética del cultivo de tonelaje más grande del mundo según la Organización de las Naciones Unidas para la Alimentación y la Agricultura (FAO).

Un artículo que describe el estudio se publica en GigaScience . Sus autores principales son Glaucia Mendes Souza, profesora titular del Instituto de Química de la Universidad de São Paulo (IQ-USP) y miembro del comité directivo del Programa de Investigación de Bioenergía FAPESP (BIOEN-FAPESP), y Marie-Anne Van Sluys, profesor titular en el Instituto de Biociencias de la misma universidad (IB-USP) y miembro del Panel Adjunto de Ciencias de la Vida de FAPESP.

«Es la primera vez que se ven todos los genes de la planta de caña de azúcar, o la gran mayoría. En proyectos anteriores de varios grupos de investigación, las secuencias tuvieron que colapsarse por falta de una herramienta de ensamblaje adecuada, por lo que eran solo una aproximación «, dijo Souza.

«Este conocimiento abre muchas posibilidades, desde aplicaciones en biotecnología hasta la mejora genética y la edición de genes [sustitución o eliminación de genes con funciones específicas]», dijo Van Sluys.

Desafíos

Como explicaron los investigadores, los híbridos comerciales de caña de azúcar actuales se han criado durante miles de años cruzando diferentes variedades de dos especies (Saccharum officinarum y S. spontaneum) y tienen un genoma altamente complejo que comprende 10 mil millones de pares de bases en 100-130 cromosomas. La secuenciación del genoma no es una tarea fácil, ya que requiere una potencia informática considerable para ensamblar los fragmentos de ADN y mantener separados los cromosomas homólogos.

A modo de comparación, el genoma del trigo contiene 17 mil millones de pares de bases pero solo 46 cromosomas, mientras que el genoma humano tiene solo 3,2 mil millones de pares de bases, también organizados en 46 cromosomas.

Aunque la tecnología disponible al comienzo del proyecto era capaz de producir secuencias largas, estas secuencias largas tuvieron que construirse a partir de fragmentos más pequeños. El ensamblaje del genoma con estas secuencias requería una potencia informática considerable, que fue suministrada por Microsoft.

La idea de la secuenciación del genoma completo de la caña de azúcar se remonta al inicio del Programa BIOEN en 2008. Una presentación de Souza en una conferencia celebrada por Microsoft y FAPESP en 2014 dejó a David Hackerman, investigador del Instituto de Investigación de Microsoft en Los Ángeles, fascinado. con los desafíos computacionales planteados por la iniciativa. Propuso una colaboración con FAPESP, que tomó la forma del proyecto «Desarrollo de un algoritmo para el ensamblaje del genoma poliploide de la caña de azúcar», con Souza como el investigador principal financiado por el programa FAPESP Research Partnership for Technological Innovation (PITE). El proyecto fue una colaboración con otros socios, como Bob Davidson, entonces investigador con Microsoft en su unidad de Seattle y ahora con Amazon.

La secuencia publicada ha permitido por primera vez identificar la diversidad en segmentos del genoma llamados promotores de genes, regiones de ADN que controlan la expresión génica.

«Aunque en algunos casos los genes son 99.9 por ciento idénticos, podemos detectar diferencias en sus promotores, y estos nos ayudan a determinar de qué antepasado derivan las copias, S. officinarum o S. spontaneum», dijo Souza. El logro permite estudiar, por ejemplo, cómo las diferentes copias contribuyen al aumento de los rendimientos de azúcar y fibra y qué copias pueden ser ventajosas para los diferentes genotipos seleccionados por los programas para criar variedades de caña de azúcar para azúcar y energía.

«El resultado confirma el liderazgo de Brasil y el estado de São Paulo en la investigación sobre la caña de azúcar, que es una planta tan importante para nuestro país. También refleja la previsión por parte de la comunidad de investigación de São Paulo y de FAPESP, con respecto al desafío de aprender sobre el genoma de la caña de azúcar para extraer conocimiento que conduzca a una mayor eficiencia y productividad. Siempre debemos recordar que la investigación sobre la caña de azúcar es uno de los factores que permitió a Brasil lograr algo que ningún otro país de tamaño similar ha logrado hasta la fecha, es decir, producir el 40 por ciento de su energía total. de energías renovables y con bajas emisiones de carbono «, dijo Carlos Henrique de Brito Cruz, Director Científico de FAPESP.

Fondo

La variedad elegida para la secuenciación fue SP80-3280 porque hay más datos disponibles sobre esta variedad en la literatura científica que sobre cualquier otra variedad. Durante el Proyecto Genoma de la Caña de Azúcar (conocido como FAPESP SucEST, 1999-2002), se secuenciaron parcialmente 238,000 fragmentos de genes funcionales de esta variedad.

Hoy, SP80-3280 se encuentra entre las 20 mejores variedades de caña de azúcar cultivadas en el estado de São Paulo. También es parte de la genealogía de varias variedades comerciales, ya que se utiliza en nuevos cruces. Su rendimiento agrícola es alto, y se vuelve a cultivar fácilmente mediante el método sett (los setts son esquejes de tallo tomados de plantas viejas que contienen uno o más brotes), por lo que es una opción para la cosecha tardía al final del año de cosecha en el estado de São Paulo .

«El conocimiento obtenido para esta variedad puede aplicarse en estudios de otros genotipos, particularmente para el descubrimiento de genes que controlan la acumulación de biomasa», explicó Augusto Lima Diniz, coautor del estudio y actualmente realiza una pasantía de investigación en el extranjero en Cold Spring Harbor Laboratory (CSHL) en los Estados Unidos como parte de su investigación postdoctoral para IQ-USP.

Souza y Van Sluys participaron recientemente en un equipo internacional que secuencia el genoma de S. spontaneum, la especie ancestral que corresponde al 10-15 por ciento del genoma comercial de la caña de azúcar. S. officinarum aporta 80-85 por ciento, y 5 por ciento son cromosomas recombinantes de estas dos especies progenitoras. El estudio se publica en Nature Genetics .

En 2018, Van Sluys fue uno de los autores de un artículo sobre los resultados de un estudio que mapeó aproximadamente la mitad del genoma monoploide de la caña de azúcar (solo un cromosoma en cada par).

Con base en la información obtenida de este último esfuerzo de secuenciación del genoma completo, los investigadores de la Universidad de São Paulo (USP) están desarrollando herramientas para la mejora genética de la caña de azúcar y probando varios genes candidatos en plantas genéticamente modificadas (GM). También están llevando a cabo estudios comparativos de genómica en grandes familias de genes con el objetivo de comprender sus contribuciones a las variedades de caña de azúcar utilizadas en los programas brasileños de mejora genética. Esperan encontrar genes que puedan aumentar los rendimientos, mejorar la resistencia a la sequía y contribuir al desarrollo de nuevos compuestos a partir de la caña de azúcar.

«También estamos ofreciendo a la comunidad un navegador Genome que se puede usar para buscar genes específicos y analizar secuencias en comparación con ejercicios de secuenciación anteriores. Esto será valioso para proyectos de biotecnología no solo relacionados con la caña de azúcar sino también con otros cultivos y plantas, «Dijo Souza.