El ‘data lake’ sanitario de España y otros proyectos de lago de datos en el mundo

España se apoya en los Fondos de Recuperación Europeos para crear el primer data lake mundial que reúna los datos sanitarios de todo un país
Por Natalia L. Pevida 16 de febrero de 2022
datos sanitarios

La aplicación del big data en medicina para recopilar, analizar y tratar la información promete un cambio de paradigma para investigar, prevenir y tratar diferentes enfermedades. España tiene previsto la creación de un data lake o lago de datos que promete situar al país en la vanguardia de la investigación. Analizamos en qué consiste este proyecto pionero y vemos las propuestas de otros países como China, Reino Unido o Estados Unidos, además de la idea europea.

El ‘data lake’ sanitario de España

En este contexto, el Gobierno de España, a través del Plan de Recuperación, Transformación y Resiliencia, tiene previsto destinar 100 millones de euros para la creación del primer data lake mundial que reúna los datos sanitarios de todo un país. Un proyecto para el que los expertos coinciden en señalar a la historia clínica electrónica, una herramienta con la que España fue pionera en el mundo, como la principal fortaleza respecto a la mayoría de países europeos, donde las historias clínicas siguen siendo registradas en papel.

Este proyecto se basará en el machine learning (herramientas de aprendizaje automático), esa subdisciplina dentro de la inteligencia artificial definida como la capacidad que tienen las máquinas para llegar a conclusiones a partir del algoritmo. En el caso del sistema sanitario español, el machine learning permitirá procesar los datos de las historias clínicas para establecer predicciones, tales como el efecto de un tratamiento en el perfil de un paciente antes de que le sea suministrado, reduciendo las probabilidades de errores y negligencias, así como para detectar factores de riesgo y emitir diagnósticos.

Para procesar toda la información recopilada, se utilizará el Procesamiento del Lenguaje Natural (PNL), válido tanto para construir bases de datos a partir de documentos médicos, como para detectar y eliminar automáticamente información de identidad de historias clínicas para así generar conjuntos de datos anónimos. En definitiva, un nuevo ecosistema formado desde la integración del sistema sanitario con los investigadores y los agentes sociales para el mejor conocimiento sobre la salud y la enfermedad.

Otras experiencias en el mundo

El proyecto español es pionero, pero la inteligencia artificial ya se emplea, desde hace unos años, en diferentes proyectos por todo el mundo. Los grandes volúmenes de datos que manejan las instituciones sanitarias de los países industrializados han inaugurado una tendencia en el sector denominada Value-based Healthcare (la atención de la salud basada en el valor), un paradigma centrado en el valor que aportan al paciente los sistemas de información capaces de intercambiar conocimiento.

Uno de los proyectos más relevantes es el iniciado en China en 2017 y que aglutina 280 millones de datos pertenecientes a la National Scientific Data Sharing Platform for Population and Health (NSDSPPH) categorizados en biomedicina, medicina básica, medicina clínica, salud pública, medicina tradicional china, farmacología, población y medicina reproductiva.

Por su parte, en EE. UU. los datas lakes impulsan en este momento multitud de proyectos destinados a la medicina personalizada. Uno de ellos es el llevado a cabo en un hospital de Arizona, donde un proyecto basado en la inteligencia artificial ha permitido monitorizar las lesiones renales derivadas del uso de ciertos medicamentos y desarrollar así un algoritmo que permite dosificar estos fármacos de otra manera para evitar dichas contraindicaciones.

Reino Unido también cuenta con proyectos señeros en esta área, como el llamado DataLoch. Este proyecto, desarrollado en la zona de Edimburgo, se basa en intercambiar y cruzar información integrada en tres fuentes: sanidad pública, sanidad privada y asociaciones de cuidados. Creado tras la pandemia, su objetivo es impulsar la investigación y la innovación a través del uso de datos.

La respuesta europea: una base única

Tan importante como un data lake sanitario es su desarrollo dentro de un marco normativo que garantice los derechos de privacidad y la protección de datos. Desde Bruselas se aboga por eliminar la compartimentación de datos sanitarios entre regiones, suprimiendo las fronteras sanitarias.

Una de sus aspiraciones es que un ciudadano pueda adquirir en cualquier farmacia europea un medicamento pautado en cualquier país miembro, sin recurrir a ningún procedimiento burocrático, algo que ya es posible entre Finlandia y Eslovenia.

Con este fin, los Estados miembros lanzaban en 2018 la Red Europea de Datos y Evidencia de Salud (EDHEN) para crear en 2024 una red federada de grandes datos para estandarizar 100 millones de datos médicos europeos, mediante la aplicación de un modelo que asegura que todas las bases de datos tienen la misma manera de estructurarlos y etiquetarlos con la finalidad de que los investigadores puedan enviar la misma pregunta de datos a la vez. Por ejemplo: “¿Cuántas personas con diabetes tipo 2, mayores de 55 años, que toman cierto tipo de medicamentos han desarrollado una complicación cardiovascular en los últimos 12 meses?”.

Sigue a Consumer en Instagram, X, Threads, Facebook, Linkedin o Youtube