Los cereales, cruciales para la alimentación y los biocombustibles, utilizan cada vez más tecnología genéticamente modificada (GM) en su producción para mejorar la resistencia y la nutrición.
por la Universidad Agrícola de NanJing
A pesar de las preocupaciones por la bioseguridad, los métodos de detección precisos como la PCR son complejos y dependen de expertos. Las técnicas espectroscópicas avanzadas, incluidas las del infrarrojo cercano y los terahercios, están surgiendo como alternativas más sencillas para identificar organismos genéticamente modificados mediante el análisis de firmas espectrales.
El aprendizaje automático, especialmente los algoritmos de aprendizaje profundo, ha mejorado significativamente la precisión de estos métodos, aunque persisten desafíos en la gestión de datos de alta dimensión y la comprensión de la naturaleza de «caja negra» del aprendizaje profundo. Es de gran importancia perfeccionar estas técnicas para una aplicación más amplia y una interpretabilidad más clara.
En julio de 2023, Plant Phenomics publicó un artículo de investigación titulado » Métodos concisos en cascada para la discriminación de semillas de arroz transgénico mediante fenotipado espectral «.
En este estudio, los investigadores investigaron primero la variabilidad metabólica en las semillas de arroz que expresan el gen cry1Ab/cry1Ac. El análisis del metaboloma reveló diferencias significativas entre las variedades de arroz transgénico y no transgénico, siendo predominantes los ácidos orgánicos, los lípidos y los compuestos orgánicos heterocíclicos. El análisis espectral mostró que las semillas no transgénicas generalmente tenían valores de reflectancia más altos que las semillas transgénicas.
El PCA de los espectros NIR indicó un desafío en la clasificación basada únicamente en datos originales, destacando la necesidad de extracción de características. Los espectros de terahercios, aunque menos separables visualmente, mostraron picos de absorción notables y variaciones entre genotipos.
El modelo CascadeSeed-1, que utiliza espectros NIR y de terahercios, demostró una precisión superior en la discriminación de variedades en comparación con otros modelos de aprendizaje automático . Para la identificación del estado de los transgénicos, el modelo CascadeSeed-2 mostró una alta precisión en diferentes variedades de arroz, y los modelos basados en espectros de terahercios generalmente superaron a los basados en NIR.
Se emplearon métodos de selección de longitud de onda para refinar el modelo, reduciendo características redundantes. Aunque esto resultó en cierta disminución en la precisión, mejoró significativamente la velocidad y eficiencia del modelo.
El estudio confirmó una correlación entre los análisis metabolómicos y espectrales, donde las características espectrales reflejan el contenido metabólico. El enfoque de modelado en cascada reconoció eficientemente semillas transgénicas de diferentes orígenes genéticos y, por lo tanto, supera a los métodos tradicionales de aprendizaje automático.
El algoritmo de retropropagación guiada fue eficaz para identificar longitudes de onda características, correlacionándolas con cambios metabólicos específicos.
En conclusión, este estudio desarrolló un método rápido y no invasivo para identificar semillas de arroz transgénico utilizando espectroscopía NIR y terahercios junto con algoritmos de aprendizaje profundo.
Si bien se observaron ligeras compensaciones en la precisión con los modelos simplificados, este enfoque parece prometedor para una mayor aplicabilidad en el mundo real en la detección de organismos genéticamente modificados y la realización de evaluaciones de riesgos.
Más información: Jinnuo Zhang et al, Métodos concisos en cascada para la discriminación de semillas de arroz transgénico mediante fenotipado espectral, Fenómica vegetal (2023). DOI: 10.34133/plantfenómica.0071