Un equipo de científicos del Servicio de Investigación Agrícola ( ARS ) y sus colaboradores han aprovechado el poder de la tecnología de aprendizaje automático para acelerar la identificación de compuestos que promueven la salud en los alimentos.
La composición química y la importancia dietética de nutrientes esenciales como la vitamina A y la riboflavina están bien definidas. Sin embargo, hay miles de otros compuestos alimenticios cuya actividad biológica y efectos en el cuerpo humano durante toda una vida de exposición a través de la dieta son poco conocidos.
Esta brecha de conocimiento se conoce como la materia oscura del «exposoma» humano, explicó Laurence Parnell, bióloga computacional del Centro de Investigación de Nutrición Humana Jean Mayer del USDA (JMHNRCA), operado conjuntamente por ARS y la Universidad de Tufts en Boston, Massachusetts. .
Para arrojar luz sobre esta llamada materia oscura, Parnell y sus colegas desarrollaron un programa de software llamado PhytByte. Utiliza algoritmos de aprendizaje automático y árboles de decisión sofisticados para predecir la actividad biológica de estos compuestos de alimentos misteriosos a partir de masas de información de base de datos.
PhyteByte aprovecha dos bases de datos. El primero, llamado FooDB, actualmente contiene un catálogo de 70.926 compuestos en los alimentos, incluidos los pigmentos vegetales que se cree que confieren beneficios para la salud, como la cianidina 3- (6 » – acetil-galactósido) de los arándanos y quercetina 3,4 ‘, 7-triglucósido en cebollas de jardín y vino tinto.
La segunda base de datos es ChEMBL. Almacena información sobre las propiedades químicas de casi 2 millones de moléculas, incluidos medicamentos farmacéuticos como la tiazolidindiona, que se usa ampliamente para tratar la diabetes tipo 2. La base de datos también es un recurso importante porque contiene información sobre la actividad biológica de muchos compuestos.
Una sesión de PhyteByte comienza ingresando el nombre de una proteína de interés, generalmente una que es el objetivo de los medicamentos recetados. El software luego pregunta a ChEMBL por estructuras químicas que son similares al objetivo farmacológico de la proteína de interés. Luego, la parte de aprendizaje automático del algoritmo crea un modelo sofisticado que se utiliza para «extraer» de FooDB un conjunto de compuestos alimenticios muy similares, junto con una lista de alimentos que contienen el compuesto y en qué cantidad.
Sin embargo, las predicciones de PhyteByte no pretenden ser pruebas independientes. Más bien, están destinados a ayudar a los investigadores a priorizar qué compuestos alimenticios son los mejores candidatos para realizar investigaciones de laboratorio y estudios clínicos reales, lo que puede llevar mucho tiempo y ser costoso.
En última instancia, el conocimiento obtenido de la investigación sobre estos compuestos candidatos contribuirá a mejorar las recomendaciones y la planificación dietética, como la de los nutricionistas , así como a una nueva visión de las respuestas genéticas de los consumidores individuales a ciertos alimentos y las interacciones entre alimentos y medicamentos, según Parnell.
Recientemente fue coautor de un artículo sobre el potencial de PhyteByte en la revista BMC Bioinformatics junto con sus colegas Kenneth Westerman del Hospital General de Massachusetts, Sean Harrington de Notemeal, Inc .; y Josè Ordovás del Laboratorio de Nutrición y Genómica de JMHNRCA.