Mapa web
Youtube
UNED

El profesor José Luis Aznarte mostró en Ourense el proyecto EsCOVID-19 DATA en el que participa el departamento de IA de la UNED

30 de abril de 2021

El doctor Aznarte  dice que esta iniciativa "pretende unificar los datos por provincias, datos coherentes, interoperables y accesibles, usados por científicos y periodistas para hacer su trabajo". 

OURENSE, 29 de abril de 2021.-José Luis Aznarte inició su ponencia hablando de aplicaciones de la IA para la salud. Una de ellas es la identificación automática de granos de polen. Clasificar polen es una tarea tediosa y no muy estimulante, que realiza normalmente PDI en formación. La utilidad de esto afecta a personas alérgicas, a recursos sanitarios y otras aplicaciones.

“Automatizar el proceso de conteo de polen ahorraría mucho tiempo y recursos”, señala Aznarte. Por eso señala que “hemos desarrollado un sistema basado en IA capaz de distinguir 46 especies”. En cuanto a otras aplicaciones relacionadas con el polen, el profesor Aznarte dice que la concentración diaria de polen de diversas especies puede ser vista como una serie temporal. Hemos desarrollado modelos de inteligencia artificial para predecir:

  •  Las concentraciones futuras de polen
  •  El inicio y final de la estación polínica

Otra acción es la predicción de la calidad del aire en Madrid. El Ayuntamiento de Madrid y los ciudadanos necesitan conocer con antelación la activación de protocolo de dióxido de nitrógeno (NO2), además de los valores de ozono (O3) y partículas en suspensión. José Luis Aznarte mostró  gráficas de los niveles de dióxido de nitrógeno en la Avenida Ramón y Cajal de la capital así como la gráfica de probabilidad de activación del protocolo de NO2 en nivel de preaviso, para el 29 y para el 30 de septiembre de 2020.

También se detuvo en la predicción de ingresos hospitalarios. “A partir de datos de contaminación (NO2, O3, CO, PM10, SO2), de polen (gramíneas-Poaceae) y meteorológicas (temperatura, lluvia), somos capaces de determinar con precisión el número futuro de ingresos hospitalarios por afecciones circulatorias y respiratorias”, indicó el ponente.

COVID19 y predicción de series temporales

El Real Decreto-Ley 8/2020, de 17 de marzo, de medidas urgentes extraordinarias para hacer frente al impacto económico y social del COVID-19, supuso 24 millones de euros para subvenciones a proyectos y programas de investigación del COVID-19 gestionado por el Instituto de Salud Carlos III. El impacto esperado consistía en:

  • Contribuir a mejorar el tratamiento de la enfermedad en la actual pandemia.
  • Contribuir a mejorar el diagnóstico y el manejo clínico de pacientes infectados por SARS-CoV-2.

  • Contribuir al diseño, desarrollo e implantación de medidas de salud pública para responder eficazmente a la epidemia en curso de SARS-CoV-2.

El proyecto de aplicación de IA a la predicción inmediata de series temporales para optimizar la gestión de recursos en epidemias obtuvo un presupuesto de 105 mil euros con un plazo de ejecución de seis meses. El equipo estaba formado por el Departamento de Inteligencia Artificial de la UNED, Inverence, expertos en desarrollo de sistemas predictivos de la demanda y la creación de sistemas de pricing y Populate, expertos en análisis de datos y visualización interactiva.

El profesor Aznarte señala como consideraciones generales de los modelos predictivos conocer el propósito de dichos modelos, si se trata de predicción a corto plazo o proyecciones de escenarios futuros; conocer las asunciones básicas, qué asumimos sobre inmunidad, transmisión asintomática y cómo se modelas los contactos. También es necesario saber cómo se maneja la incertidumbre y cómo se calculan los rangos de las predicciones o de los parámetros. Necesario es saber igualmente cuáles son los datos en los que nos basamos, si son fiables, por ejemplo, casos confirmados versus hospitalizados/fallecidos. Del mismo modo hay que saber si es un modelo general o para un contexto concreto y si la escala espacial (nacional, regional, local) es adecuada para el propósito del modelo. También hay que tener en cuenta cómo afecta la escala a las asunciones, por ejemplo movilidad.

 

Modelos mecanísticos basados en ecuaciones, familia SIR:

  •  Por medio de información detallada sobre el tamaño y la densidad de población, la edad media, el tamaño de la red social, el sistema sanitario &c, se genera una «copia virtual» de una ciudad, región o país.
  • Se calculan ecuaciones diferenciales que gobiernan las interacciones de la población en el espacio y en el tiempo.

  • Requiere información clave y difícil de estimar al principio como la proporción de fallecidos o el número básico de reproducción (R0). De estos parámetros depende la bondad del modelo.

  • Permiten la elaboración de escenarios a medio plazo mediante la variación en los parámetros iniciales.

Modelos basados puramente en datos:

  • A partir de la evolución de las series temporales de interés, los modelos «aprenden» del pasado de la epidemia y predicen el comportamiento a corto plazo.
  • No requieren conocimiento epidemiológico a priori.

  • Es necesario disponer de grandes volúmenes de datos.

Modelos mixtos:

  • A partir de los datos son capaces de ajustar los parámetros de  modelos mecanísticos.
  • Por ejemplo, ajuste dinámico del R0 en un modelo SIR.

  • Tienen estructura de base teórica pero pueden representar el contagio de modo dinámico.

  •  Los datos son en este modelo esenciales pero la estructura del modelo está fijada conforme a la teoría epidemiológica.

En la predicción de series temporales de COVI-19 existen dificultades y amenazas. Estamos ante un escenario cambiante, con prioridades y objetivos en ocasiones inciertos. Hay decisiones políticas que afectan a la solidez de los datos y una falta de homogeneidad, por ejemplo, en saber qué es un caso pues, como señala el ponente:

 

  • Hay cuatro tipos de criterios: clínicos, de radiodiagnóstico, de laboratorio o epidemiológicos (según el European Centre for Disease Prevention and Control)
  • Casos “posibles”, “probables” o “confirmados”.

  • Hay quien considera casos a los probables+confirmados.

  • Diversidad de tests: PCR, PCR en saliva, antígenos, anticuerpos.

  • Precisión de los tests: falsos positivos y falsos negativos.

Con los datos hay:

  •  Problemas de agregación:
    • Espacial: cada Comunidad Autónoma comunica los datos de una manera.

    • Temporal: los datos no se comunican siempre con la misma regularidad.
  • También hay notificaciones con retardos.
  • No se garantiza la continuidad de las series.

  • Datos en dispersos, incoherentes y en formatos no interoperables.

  • Faltan datos esenciales:
    • Camas UCI: datos de 2017 (Estadística de Centros Sanitarios de Antención Especializada, SIAE).
    • Movilidad (datos no públicos: operadoras de telefonía).

    • Densidad habitada (número de habitantes por km2 habitado).

    • Capacidad diagnóstica.

    • Capacidad de rastreo.

El proyecto se denomina EsCOVID-19DATA, resultado de un esfuerzo colectivo, distributivo, voluntario y espontáneo. Pretende unificar los datos por provincias, datos coherentes, interoperables y accesibles, usados por científicos y periodistas para hacer su trabajo. Integran fuentes de datos muy diversas y un ejemplo es la ciencia abierta. En cuanto a los avances realizados, en los modelos predictivos actuales de series temporales de COVID-19:

 

  • Para confirmados, hospitalizados, ingresados UCI y fallecidos, se han armado modelos univariantes de series temporales conanálisis de intervenciones: ARIMA bayesianos.
  • Estamos trabajando en modelos en cascada que permitan integrar regresión no lineal (redes neuronales).

  • Para exceso de mortalidad, se ha creado un modelo de agregación que combina la información semanal del INE con la información diaria del Sistema de Monitorización de la Mortalidad diaria (MoMo) para generar predicciones diarias (de momento solo por CCAA, pronto también por provincia).

José Luis Aznarte mostró, para rematar su ponencia, un listado de predicción por comunidades autónomas muy completo y terminó su intervención  refiriéndose a los pasos futuros en este campo, que pasan por refinar la escala espacial: predicción por municipios, distritos sanitarios/hospitales, hacer una puesta de servicio de acuerdo con el Centro Nacional de Epidemiología (ISCIII) y el Centro de Coordinación de Alertas y Emergencias Sanitarias (CCAES) y refinar los modelos con nuevas variables: búsquedas en internet, vulnerabilidad,densidad de población, capacidad diagnóstica, aguas residuales,movilidad, y con nuevas arquitecturas de redes neuronales: redes neuronales espacialmente agnósticas, ConvLSTM…

Este ciclo de conferencias que forman el seminario organizado por la UNED para Ourense, se emiten desde el Centro de Intelixencia Artificial de la ciudad y cuentan con el apoyo económico del Vicerrectorado de Investigación, Transferencia del Conocimiento y Divulgación Científica de la UNED.     

Puedes ver en diferido la conferencia de José Luis Aznarte aquí.

UNED Ourense

Comunicación

Carretera de Vigo Torres do Pino  s/n Baixo 32001 Ourense - . Tel. 988371444 info@ourense.uned.es