Compartir datos agrícolas: tecnología de contabilidad distribuida para mejorar el aprendizaje automático en el fenotipado de plantas


El fenotipado de plantas, que explora la interacción entre los genotipos de las plantas y su entorno, ha avanzado con la detección automatizada de alto rendimiento en invernaderos. Sin embargo, gestionar los extensos conjuntos de datos resultantes es complejo y compartir dichos datos está restringido debido a su naturaleza costosa y técnica.


por la Universidad Agrícola de NanJing


Revolucionando el intercambio de datos agrícolas: adoptando la tecnología de contabilidad distribuida para mejorar el aprendizaje automático en el fenotipado de plantas
Ejemplo de ecosistema de mercado. Crédito: Fenómica vegetal

A pesar de los estándares de gestión de datos existentes como MIAPPE y FAIR, persisten los desafíos en las aplicaciones de aprendizaje automático (ML), principalmente debido a la necesidad de grandes volúmenes de datos etiquetados de alta calidad. La renuencia de las partes interesadas a compartir datos, impulsada por preocupaciones sobre los derechos de propiedad, obstaculiza el progreso.

En julio de 2023, Plant Phenomics publicó un artículo en perspectiva titulado » ¿Pueden los libros de contabilidad distribuidos ayudar a superar la necesidad de datos etiquetados para tareas de aprendizaje automático agrícola? «. Este artículo promueve un enfoque colaborativo en el manejo de datos y el entrenamiento de modelos de IA para el fenotipado de plantas y sugiere el uso de tecnología de contabilidad distribuida con contratos inteligentes para superar las limitaciones actuales.

El sistema actual enfrenta desafíos importantes, incluida la adquisición y el procesamiento de datos no estandarizados, riesgos de erosionar los reclamos de propiedad, posible uso indebido de datos y falta de armonización de los datos. Aunque estándares como MIAPPE o ISA-TAB pueden abordar algunos de estos problemas, persisten las preocupaciones sobre la privacidad de los datos, el uso indebido y la ausencia de incentivos suficientes para compartirlos.

El ecosistema propuesto tiene como objetivo resolver estos problemas aprovechando la tecnología de contabilidad distribuida, conocida por el intercambio de datos seguro y responsable, junto con estructuras de incentivos para fomentar la participación. Este sistema distribuido basado en libro mayor no solo ofrece beneficios financieros sino que también fomenta la colaboración y la gobernanza electrónica dentro de una red dinámica, interoperable y descentralizada. Prevé un entorno colaborativo en el que participan activamente partes interesadas como usuarios de datos, proveedores, curadores y creadores de modelos de IA/ML.

Para evitar monopolios y fomentar la diversidad, la propuesta sugiere múltiples mercados interoperables, que permitan a las partes interesadas elegir mientras acceden a todo el ecosistema. Este enfoque también incluye mecanismos de gobernanza electrónica, reduciendo la dependencia de intermediarios y creando una plataforma neutral para todos los participantes. Sin embargo, se reconocen desafíos como las preocupaciones por la privacidad , la integración con sistemas heredados, el cumplimiento legal y la necesidad de un mecanismo de liquidación entre tokens y monedas fiduciarias.

En el contexto de la agricultura, este ecosistema tiene el potencial de revolucionar la recopilación y utilización de datos, particularmente en la predicción de enfermedades y el pronóstico de rendimiento. Los agricultores podrían desempeñar una doble función como proveedores y consumidores de datos, contribuyendo y beneficiándose de modelos de aprendizaje automático más precisos. Esto mejoraría la confiabilidad de los pronósticos y la toma de decisiones agrícolas, lo que conduciría a una mejor gestión y productividad de los cultivos.

En conclusión, este enfoque presenta una solución integral a los desafíos actuales del intercambio de datos en el fenotipado de plantas. Al conectar diversos conjuntos de datos con metadatos e incentivar a las partes interesadas, su objetivo es mejorar la precisión y utilidad de los modelos de aprendizaje automático en la diversidad, transformando potencialmente las prácticas agrícolas modernas.

Más información: Stefan Paulus et al, ¿Pueden los libros de contabilidad distribuidos ayudar a superar la necesidad de datos etiquetados para tareas de aprendizaje automático agrícola?, Plant Phenomics (2023). DOI: 10.34133/plantfenómica.0070