Sistema ciberfísico inteligente para soporte de agricultura ecológica

Investigador principal

Carlos León de Mora

Sede

US

Tecnología

Machine Learning

IoT

Blockchain

BigData

Sector

2

Agentes agregados

SOLTEL IT SOLUTIONS SLU

Resumen de la propuesta

El objetivo del proyecto es el desarrollo de un sistema ciberfísico, compuesto por una plataforma de analítica inteligente empleando Machine-Learning, y nodos IoT, que integran cámaras hiperespectrales portables y de uso sencillo en campo. El sistema permitirá medir y analizar múltiples parámetros en distintos cultivos, asistiendo al agricultor en la toma de decisiones, permitiendo conocer la calidad y evolución de la producción y su trazabilidad mediante la tecnología Blockchain, tarea fundamental para la agricultura ecológica.

Objetivo del proyecto

En el sistema propuesto, el nodo IoT hiperespectral  actuará como dispositivo captador de la información, pre-procesándola localmente mediante IA, antes de enviar los datos a la plataforma de computación en la nube. En dicha plataforma será necesario desarrollar una herramienta basada en Machine Learning que, desplegada sobre una plataforma BigData (para integrar tanto datos de los nodos IoT como otras fuentes heterogéneas externas), permita analizar la información. Con todo ello, se tendrá, por un lado, la posibilidad de asistencia experta al agricultor para una toma de decisiones óptima, y por otro, el registro seguro e inalterable de parámetros fundamentales empleando Blockchain. Esto permitirá garantizar la calidad y trazabilidad del producto, requisito fundamental en la agricultura ecológica.

Disponer de esta información de forma rápida da una ventaja competitiva a los agricultores, que pueden estimar y planificar el momento óptimo de recolección de los cultivos, como pueden ser aceitunas, tomates, o aguacates, por ejemplo, para mejorar la calidad y el beneficio económico de las campañas.

Resultados esperados e indicadores

Nuevo personal investigador: 1
Patentes: 1 (Nodo IoT)
Nº Contratos de transferencia: 1 (en base a la línea del proyecto se concurrirá a convocatorias nacionales –CDTI o similar_ o autonómicas para buscar financiación con la que aumentar el alcance y aplicación de los equipos desarrollados.
Congresos: 2    
Publicaciones Indexadas: 2 en revistas JCR Q1/Q2, tipo Sensors o similar
Tesis Doctorales: se iniciará una tesis en las líneas del Proyecto, aunque por el plazo del mismo (21 meses) no se espera que pueda concluirse antes del 12/2021).

Justificación potencial impacto tecnológico del proyecto (TRL)

La tecnología hiperespectral tiene un enorme potencial disruptivo en el sector agroalimentario, aunque en la actualidad, las cámaras son muy caras y voluminosas, útiles sólo en ambientes controlados (laboratorios o plantas). El impacto sería mayor con su uso en campo, lo que requiere equipos fiables, portables, alta conectividad y aplicaciones de analítica online. Ya existen sensores hiperespectrales portables probados en laboratorio (TRL3). El proyecto pretende llevarlos a un nivel TRL7 añadiendo calibración y corrección espectral de las condiciones ambientales.  

Avances

Considerando que el proyecto pretende el desarrollo de un sistema ciberfísico que permite medir y analizar múltiples parámetros en distintos cultivos, se han considerado dos fases. En la primera fase, la que se describe en este informe, se ha creado una base de datos con las firmas espectrales de los diferentes objetivos de análisis con el propósito de facilitar la obtención de clasificadores eficientes. En la segunda fase se implementará el sistema ciberfísico tanto a nivel hardware como a nivel software. Como ejemplo de cultivo se ha considerado la aceituna para la producción de aceite de oliva virgen extra.

Para que firmas espectrales sean representativas ha sido necesario:

  • Validar las imágenes que se han utilizado como modelo.
  • Identificar el tipo de iluminación recibida.
  • Calcular las correcciones espectrales de las áreas de interés pre-etiquetadas.
  • Calcular los factores de escala que relacionan las dimensiones reales de las medidas en pixels dentro de la imagen.
  • Calcular las firmas espectrales unívocas (que identifican con gran seguridad el grado de maduración) más frecuentes presentes en un mismo grado de maduración.

El modelo de conocimiento se ha basado no en una, sino en un conjunto de firmas. Este método facilita la interpretación de los modelos y aumenta la efectividad y velocidad de detección de los clasificadores.

Una vez creada la base de conocimiento se ha procedido al entrenamiento de los clasificadores. Se ha optado por el paradigma conocido como «Aprendizaje Supervisado», donde a cada ejemplo se le asocia una etiqueta discreta con la que se identifica su pertenencia a un grupo o clase. El conjunto de ejemplos se utiliza tanto para entrenar los algoritmos, como para validar los resultados de su aprendizaje. El objetivo del aprendizaje puede ser la clasificación de nuevos ejemplos o la inferencia predictiva.

Las prestaciones del clasificador o predictor se han evaluado mediante la exactitud predictiva (para los clasificadores) y la confianza (en los predictores).

Se ha entrenado diversos clasificadores para la detección de aceituna, entre otros: regresión logística, lista de decisiones, red bayesiana, discriminante lineal, algoritmo de vecindad: KNN, máquinas de vectores de soporte SVM, red neuronal y árboles de decisión: C&R, C5, Quest y CHAID.

Igualmente, se han entrenado diversos predictores (modelos de regresión), en los que la salida es un valor numérico (conteo de aceitunas e índices de maduración) se han ensayado estos otros algoritmos: regresión lineal, regresión generalizada, algoritmo de vecindad: KNN, máquinas de vectores de soporte con regresión SVR, regresión lineal, red neuronal, arboles de decisión y bosques de decisión.

Gráfico 4