Machine Learning para facilitar la toma de decisiones de los gobiernos

Las provincias y comunidades autónomas se enfrentan a un reto importante ya que para poder implementar las medidas de escalado y re-escalado necesitan modelizar todos los parámetros relevantes. Este gran reto se resolvería con un modelo dinámico de machine learning para la monitorización y el análisis de los datos. Gracias a un algoritmo de aprendizaje continuo se conseguiría la monitorización de zonas básicas de salud (delimitaciones geográficas oficiales mediante las cuales se planifican los recursos sanitarios para asegurar que la población tendrá acceso a una cobertura homogénea), la priorización de restricciones de movilidad y sobre todo una anticipación a la temible campaña de la gripe de este otoño. 

¿Cómo cambiará la transmisibilidad y la dinámica de la epidemia según las estrategias que se vayan tomando de escalado? ¿Qué capacidad tiene el sistema sanitario y cuál debería tener para conseguir mantener la actividad asistencial no covid-19? ¿Cuál es la probabilidad de tener un 2º brote? Y si lo hubiera, ¿cuánto tiempo tenemos para actuar y qué deberíamos hacer para estar preparados?

La necesidad de hacerse las preguntas correctas ha sido el punto de partida para encontrar una solución al reto que nos planteamos: ¿Cómo puedo modelizar todos los parámetros para hacer una política de escalado y re-escalado inteligente que ayude al gobierno en la toma de decisiones?

Objetivo marcado

Diseñar un modelo dinámico de identificación de factores de correlación de parámetros del territorio y la movilidad con interacción en la propagación de la COVID-19 y en la propia capacidad del sistema sanitario.

Marco de trabajo

Durante la primera sesión de trabajo el pasado miércoles 15 de abril mantuvimos un intercambio de perspectivas muy enriquecedora por lo multidisciplinar de este grupo de trabajo.

Además de las cuestiones puramente epidemiológicas del coronavirus, debatimos sobre las diferentes estrategias de distanciamiento social y de cómo se ha observado que las medidas que no van acompañadas de estrategias activas, como la realización de test de diagnóstico en zonas localizadas o el rastreo y trazabilidad de contactos, no son suficientes. Una vez que se escala el confinamiento, el riesgo de repunte o de nuevos brotes es alto.

Figura: Estudio sobre el impacto de las medidas de distanciamiento social en la propagación de una pandemia (22 de Marzo; IDSS MIT/Universidad de Zaragoza/UC3M/ISI Foundation)

Otra de las cuestiones planteadas y que complicaban aún más la toma de decisiones acertada, es la ausencia de evidencias científicas. Los científicos van rápido. A una velocidad sin precedentes. Pero a día de hoy, no sabemos qué inmunidad vamos a desarrollar o si existen riesgos de reinfecciones Nuestro modelo tenía que ser dinámico, que se adaptara a las nuevas realidades y que fuera explicativo para entender el cómo y el porqué de lo que vaya sucediendo.

Respecto a la movilidad en el territorio de la población, tuvimos claro que cualquier monitorización adquiere dimensiones muy pequeñas.  Nuestro modelo debía establecer una dimensión espacial a escala micro-urbana y en tiempo real para localizar los focos de contagio e identificar de forma temprana los cambios en las dinámicas de contagio.

Por último, nuestro objetivo debía enmarcarse en aquella variable que impactara sobre lo más importante de la epidemia: salvar vidasNuestro modelo tendría que ser capaz de predecir y evitar la saturación del sistema sanitario y debía permitir la preparación para posibles repuntes o próximos hitos sanitarios como la campaña de gripe de este año en otoño.

Con todas estas certezas sobre las necesidades del modelo, la solución que conceptualizamos y diseñamos durante los días siguientes ha consistido en un…

Modelo de datos dinámico basado en la evolución epidemiológica, el territorio y la movilidad de la población en tiempo real, que sirvan de herramienta para la planificación estratégica y la toma de decisiones informadas durante el escalado de medidas y orientada al control de la gestión de la epidemia, la propagación de la COVID-19 y evitar la saturación del sistema sanitario.

Beneficios del modelo

Los impactos y beneficios directos del Modelo:

  1. Proveer de una herramienta para la toma de decisiones informada y estratégica en tiempo real y basada en el territorio:
    • Inteligencia de medidas de escalado y desescalado en la población
    • Inteligencia espacial en la realización de test de diagnóstico
    • Control de saturación del sistema sanitario
  2. Evaluar el impacto de medidas de escalado y re-escalado en tiempo real y monitorizar la evolución de la epidemia y posibles rebrotes
  3. Identificar factores de correlación siguiendo un modelo adaptativo y explicativo

Los impactos indirectos del Modelo: 

  • Facilitar la recuperación del sistema sanitario
  • Facilitar la reanudación de protocolos de vigilancia enriquecidos con monitorización en tiempo real 
  • Preparar la próxima llegada de la campaña de otoño de gripe de este año

La base del modelo

El modelo se basa en la localización temprana de casos positivos, sintomáticos y asintomáticos, y población expuesta a ellos, así como en el aprendizaje continuo que permita ir adaptando el modelo para la máxima explotación de sus resultados y hallazgos.

  • Modelo Funnel
    • Autodiagnóstico (primeros síntomas)
    • Detección temprana (reportes de patologías respiratorias en centors sanitarios)
    • Diagnóstico (resultados positivos de test de diagnóstico localizados que permiten la identificación de población expuesta a positivos)
    • Camas UCI (capacidad/ocupación)
  • Modelo de aprendizaje continuo:
    • Adaptativo a las nuevas realidades (dinámico)
    • Flexible a la introducción de nueva información disponible
    • Explicativo (entender los cómo y los porqués) y predictivo
    • En tiempo real

Funcionalidades del modelo 

Las principales funcionalidades que permite el Modelo son:

  • Predicción de celdas de riesgo: Establecimiento de parámetros de peligrosidad que describen los focos de contagio y los factores de correlación urbanos
  • Identificación y seguimiento espacial de los focos de contagio: Identificación y localización de los focos, su evolución espacial y temporal, densidad de afectados, volumen de población expuesta y número de probables asintomáticos en cada foco y velocidad de contagio
  • Identificación temprana de los espacios clave de actuación para frenar la propagación. Esto permite:
    • Priorizar y/o intensificar medidas anticontagio
    • Identificar las zonas idóneas para la realización de test de diagnóstico
    • Identificar temprana posibles rebrotes
    • Identificar zonas candidatas al desconfinamiento (zonas limpias)
  • Evolución de ocupación y predicción de la saturación del sistema sanitario y en base a otros hitos sanitarios de elevado impacto como la próxima campaña gripe de otoño 
  • Establecimiento de patrones de predicción desde el inicio de la transmisión
    • Posible integración de la próxima App de autodiagnóstico nacional 
    • Inclusión de reportes patologías respiratorias en centros de salud

Modelo a escala nacional 

Tomamos como punto de partida dos proyectos en marcha de dos de los participantes del equipo, la Plataforma cartográfica del Proyecto de Cartografía Riesgo COVID-19 de la Asociación de Geógrafos Españoles (AGE)[1] que cuenta con un piloto sobre la provincia de Málaga completamente testado; y los resultados del Estudio sobre el impacto de las medidas de distanciamiento social en la propagación de una pandemia[2] realizado sobre la ciudad de Boston sobre datos reales del territorio y de la movilidad y actualmente realizándose sobre la ciudad de Nueva York, para escalar el Modelo a nivel nacional.

[1] Experiencia coordinada por la Cátedra de Seguridad, Emergencias y Catástrofes a cargo del Equipo de Investigación de Análisis Territorial de Riesgo de la Universidad de Málaga en colaboración con 17 universidades españolas. Coordinadora del proyecto: Mª Jesús Perles Rosello (Universidad de Málaga)

[2] Autores: David Martín-Corral (Universidad Carlos III de Madrid y Zensei Technologies SL), Alberto Aleta y Yamir Moreno (Instituto de Biocomputación y Física de Sistemas Complejos, Universidad de Zaragoza y Fundación ISI de Turín), Alex Pentland (Connection Science, Institute for Data Science and Society, MIT, Cambridge), Esteban Moro (Universidad Carlos III de Madrid y Connection Science, Institute for Data Science and Society, MIT, Cambridge).

Llamada a la acción

Para que el modelo y los resultados sean robustos, resulta imprescindible:

  • Normalización de datos entre CCAA
  • Acceso a datos geolocalizados y anonimizados de movilidad y casos positivos con los que ya cuenta la administración 

Equipo de trabajo

Adolfo García-Sastre, Adrian Alonso, Andrea Barbiero, Armando Ramos Garcimartín, Cristina Martín-Arriscado Arroba, Cristina Sánchez, Dariusz Narankiewicz, David Vivancos, Eduardo Rodés, Ernestina Menasalvas, Estanislao  Nistal, Javier  Illana Alejandro, Laura Calvet Liñán, Mario Enjuanes, Miguel Escassi, Patricia O’Donnell, Pedro Muñoz, Yamir Moreno

Cómo contactar

Escribe un email a info@dataforhope.com o déjanos tus datos para que nos pongamos en contacto contigo