Plataforma Cloud para la integración espacial de geoinformación ambiental y socioeconómica (Spatial Big Data) y clientes web interactivos (geovisores, dashboard) para su difusión, acceso, explotación y análisis (maching learning)

En los últimos años ha surgido, en el contexto del “spatial big data”, una nueva problemática ligada a la dificultad de la integración espacial de geodatos de diferentes modelos (raster y vectorial).

Investigador principal

JOSÉ OJEDA ZÚJAR

Sede

US

Tecnología

SPATIAL BIG DATA, MACHINE LEARNING, SIG Y BUSINESS ANALYTICS

Sector

2

Agentes agregados

EMPRESA Geografía Aplicada S.L --“ (filial de la empresa tecnológica “CARTO”, especialista en “LOCATION INTELLIGENCE”)

Resumen de la propuesta

En los últimos años ha surgido, en el contexto del “spatial big data”, una nueva problemática ligada a la dificultad de la integración espacial de geodatos de diferentes modelos (raster y vectorial). Esta integración es esencial para su análisis con técnicas de Maching Learning (AI). En 2018 se hizo pública la especificación OGC (http://www.opengeospatial.org/projects/groups/dggsswg) para facilitar la estandarización de los procesos de integración en estructuras multiescalares (nested) grid a escala global (Discrete Global Grid System DGGS--): Este proyecto pretende abordar 3 aspectos relacionados con esta problemática, potenciales objeto de transferencia: (i) Científicos: la integración espacial de la geoinformación ambiental, socioeconómica y territorial básica de Andalucía (catastro, usos, población, datos climáticos, urbanísticos, etc.) en estructuras de teselas multiescalares y multidimensionales GRID (cuadrados, hexágonos, etc..); (ii) tecnológicos, al desarrollar el proyecto en un entorno CLOUD garantizando las especificaciones OPEN DATA y FAIR; y (iii) acceso a resultados con el desarrollo de clientes web (geovisores y dashboard) para la difusión, acceso y explotación de los resultados del proyecto, así como para la transferencia de conocimiento y tecnología a la ciencia, administración y ciudadanos.

Objetivo del proyecto

La integración espacial de la geoinformación ambiental, socioeconómica y territorial básica de Andalucía (Catastro, usos, población, datos climáticos, urbanísticos, etc.), de tal forma que los usuarios (científicos, técnicos de la administración y ciudadanos) puedan acceder a un amplio conjunto de geodatos multitemáticos ya integrados espacialmente en estructuras de teselas multiescalares y multidimensionales (cuadrados, hexágonos, etc.). Con ello la estructura de datos final se compondría de una única tabla donde se almacena el identificador único de la rejilla (su nivel escalar, x e y), su geometría y la estructura que se considere más adecuada para registrar las variables temáticas derivadas de la adscripción (BBDD espacial SQL y/o No SQL--). Esta estructura facilitará su análisis con procesado distribuido (parallel computing) y técnicas big data (Map Reduce). Además su estructura parecida a un vector n dimensional para cada tesela de la rejilla y nivel escalar, es una de las estructuras de datos más comunes que alimentan a los procesos analíticos de Machine Learning (ML) e Inteligencia Artificial (AI).

Desde el punto de vista tecnológico se propone el desarrollo en un entorno cloud que, en principio, utilizaría una nube privada con los diferentes servidores que el grupo tiene alojados en el CICA, para posteriormente testar su escalabilidad en una nube pública (Amazon, Microsoft Azure, etc.). El modelo de computación propuesto estaría basado en contenedores (Amazon Elastic Container Service o Google Kubernetes ) y una arquitectura de microservicios comunicándose entre sí, por ejemplo, a través de peticiones HTTP a sus APIs. El utilizar “open source” para el desarrollo de los servicios y la publicación de los resultados como servicios interoperables OGC, garantizando las especificaciones OPEN DATA y FAIR, lo sitúan en la línea estratégica de las iniciativas más r innovadoras para la Ciencia en la Unión Europea, la European Open Science Cloud (https://ec.europa.eu/research/openscience/index.cfm?pg=open science cloud).

Para la difusión de los resultados, su acceso y explotación a través de Internet, se propone el desarrollo de clientes web con el desarrollo de un conjunto de componentes (witgets) que permitan la generación de dashboards con las funcionalidades más demandadas (visualización cartográfica, generación de gráficos, etc ). Estos clientes se beneficiarían de las mejoras que proporciona HTML5 y los desarrollos para datos geográficos en “canvas” o WebGL. El contar con la empresa GEOGRAPHICA (e implícitamente CARTO) como “agente agregado” garantiza, por su experiencia internacional, la competencia técnica para culminar con éxito este objetivo facilitando las labores de transferencia de conocimiento a la sociedad, administración y científicos, al permitir el acceso y reutilización (transferencia de innovación) de los resultados con aplicaciones orientadas a productos turísticos innovadores, e gobierno o la adaptación al cambio climático.

Resultados esperados e indicadores

Indicadores (esperados hasta el 31/12/2021)

  • Nuevo personal investigador (equivalente anual): la suma de los dos contratos equivaldría a algo mas de 1 contrato predoctoral.
  • Patentes: Aunque los desarrollos informáticos de metodologías científicas son difícilmente patentables, si sería posible su inscripción en el Registro de la Propiedad intelectual y se liberarían con licencia Creative Commons.
  • Nº contratos transferencia: 1
  • Congresos (4 comunicaciones): 2 comunicaciones a 1 nacional y 2 a 2 internacionales. Congreso Nacional de las Tecnologías de la Información Geográfica, Congreso Internacional Anual FOSS4GIS, Congreso Internacional de Tecnología, Ciencia y Sociedad
  • Publicaciones indexadas: 4 JCR. 2 en revistas de base tecnológica (Environmental Modelling & Software, International Journal of Digital Earth, Environmental Monitoring. Y 2 en revistas de geoinformación (Science of the Total Environment, Natural Hazards y el Boletín de la Asociación de Geógrafos Españoles)
  • Tesis doctorales: 1

Justificación potencial impacto tecnológico del proyecto (TRL)

La integración espacial de datos ambientales y socioeconómicos en estructuras de las teselas multiescalares y multidimensionales supone un reto y tendrían un importante impacto tecnológico por su evidente carácter innovador (los procesos de adscripción a las teselas están aún en TRL 5-7). Por otra parte, la utilización de tecnologías basadas en una estructura de microservicios para su generación en la nube, y el desarrollo de clientes web (dashboard) para su acceso, tendrá un evidente impacto científico/tecnológico, al poder ser reutilizadas por nuevos proyectos científicos, empresariales o la administración debido su publicación en la nube bajo las especificaciones de la OPEN DATA y FAIR (TRL 7-8). El elemento más innovador y de mayor impacto en transferencia para el futuro sería trasladar toda la funcionalidad del proyecto (TRL-9) a una nube pública (Microsoft Azure, Amazon, etc.) o incluso, aprovechar las convocatorias de proyectos europeos que incorporen este entorno tecnológico y posibiliten la explotación y despliegue de los resultados del proyecto (Proyectos Europeos H2020 European research infrastructures (including e-Infrastructures) y la Implementación de la European Open Science Cloud).