‘Data lake’ sanitario: qué es y cómo puede mejorar nuestra salud

Este proyecto utiliza el big data para acelerar la investigación médica, prevenir y tratar enfermedades
Por Natalia L. Pevida 8 de febrero de 2022
datos data lake
Imagen: geralt

En los últimos años, la renovación de los modelos de gestión sanitaria se ha convertido en una prioridad para muchos países. Para hacerlo, se ha apostado por la inteligencia artificial como una de las herramientas clave que ayudará a optimizar la atención de los pacientes y la prevención de enfermedades. Pero no se trata de un cambio repentino de la hoja de ruta. Con el aumento de la esperanza de vida y los avances de la ciencia médica, se han creado los llamados data lakes. A continuación te contamos qué es un data lake sanitario y sus aplicaciones más importantes.

¿Qué es un ‘data lake’ sanitario?

Los data lakes son unos repositorios centralizados de datos en bruto –sin estructurar ni clasificar– que pueden ser procesados con herramientas de big data. Su objetivo es facilitar el flujo de información, adecuando la manera de clasificar variables clínicas y, en definitiva, mejorar la capacidad de prevenir, diagnosticar y tratar los problemas de salud.

Con los Fondos de Recuperación Europeos, España afronta el reto de convertir al sistema sanitario en un ecosistema de conocimiento integrado para hacer visibles los mecanismos más desconocidos de la salud y la enfermedad.

Más allá de las historias clínicas

La automatización de multitud de procesos mediante la inteligencia artificial es una constante en la actualidad. Los data lakes se presentan como una solución para almacenar enormes cantidades de información que no están estructuradas ni filtradas. Una vez guardados todos esos datos, el big data le dará un propósito concreto cuando se consulta.

“Hoy en día, la cantidad de información médica que se genera es muy abundante. Mucha procede de hospitales (pruebas de radiología, laboratorios, tratamientos) y otra de los niveles asistenciales de Atención Primaria, como urgencias o las recetas electrónicas. En medicina es importante la contextualidad de los síntomas, por eso el reto está en la homogeneización de toda esa información”, explica Antonio Urda, traumatólogo y vicepresidente de Hospitales en Savana, compañía tecnológica especializada en data lakes sanitarios.

La captación y el almacenaje de información da lugar a dos tipos de bases de datos:

  • una primera, sin la información personal de los pacientes, pero cuyo gestor sí mantendría la capacidad de identificar cada dato.
  • una segunda completamente anónima, es decir, sin posibilidad de identificar a los pacientes que generan dichos datos.

¿Para qué sirve un ‘data lake’ sanitario?

“Contar con una base de datos en la que se pueda contactar con cada paciente es muy útil en los casos de alerta sanitaria, para identificar a la vez a todas las personas que podrían estar afectadas sin necesidad de acudir a muchas fuentes de información diferentes”, apunta el doctor Urda, quien cita como ejemplo la detección de fallos en lotes de marcapasos, implantes o prótesis.

También puede ayudar para reclutar pacientes para ensayos clínicos. “Por ejemplo, si hay un estudio abierto, se puede acudir a esta base de datos para detectar a todos esos pacientes que han agotado sus distintas líneas de tratamiento oncológico y podrían beneficiarse de esa nueva línea de tratamiento”, añade Urda.

Otro caso de cómo puede ayudar un data lake sanitario lo aporta Sergio Cinza, director de la Agencia de Investigación de la Sociedad Española de Médicos de Atención Primaria (SEMERGEN). “Sabemos desde hace años que los pacientes con psoriasis tienen más riesgo cardiovascular que otros enfermos porque hay un mecanismo inflamatorio común detrás de ambas patologías que se ha estudiado muy poco”, explica. Para intentar entender esta relación, han puesto en marcha el estudio REPICA, que está reclutando en Atención Primaria a 102 pacientes con psoriasis para analizar factores de riesgo cardiovascular, tratamientos, si tienen o no enfermedad cardiaca y su pronóstico para seguirlos durante cinco años. “Disponer de una plataforma de data lake nos permitiría ahorrar estos cinco años de estudio y aumentar el volumen de participantes a 2.000 para conseguir una potencia estadística suficiente para identificar el tipo de paciente con psoriasis que tiene alto riesgo de desarrollar una enfermedad cardiovascular”, explica Sergio Cinza.

Para los expertos, las conclusiones del algoritmo permiten ir más allá de la estadística clásica, lo que supone un avance para los estudios sobre enfermedades raras, cuya baja prevalencia y dispersión de los pacientes dificultan las predicciones y actuaciones sobre la evolución de las patologías.

datos data lakeImagen: herbert11timtim

¿Y si los datos son anónimos?

Contar con una base de datos completamente anónima permitiría un cambio de paradigma en los estudios de investigación con grandes muestras de población. De este modo, se podrían emplear diferentes variables del aprendizaje automático para anticipar en el tiempo con más precisión los factores de riesgo que determinan muchas enfermedades.

También serviría para detectar en tiempo real nuevas epidemias infecciosas y para entender sus procesos de transmisión y mejorar así la prevención.

¿Para qué se puede utilizar?

Según Savana, en resumen, estas son las aplicaciones de los data lakes:

  • Estudios observacionales basados en la evidencia de casos reales. Se puede aplicar a la investigación clínica de  fármacos, de productos sanitarios o de protocolos de abordaje clínico o terapéutico.
  • Reclutar pacientes para ensayos clínicos. Los investigadores a cargo de estos ensayos pueden acceder a la información de posibles pacientes de forma muy rápida.
  • Plataforma de visualización y análisis de datos. Esta información estará disponible para los centros y autoridades sanitarias, para la gestión de recursos o la toma de decisiones.
  • Modelos predictivos. Para la elección guiada de tratamientos (medicina personalizada) o para anticipar la derivación a especialistas.
  • Nuevos modelos de gestión sanitaria. Hacer seguimiento de la nueva tecnología sanitaria adquirida por los hospitales para saber si es efectiva o no.

De pacientes a personas

La investigación basada en data lakes significa un cambio de situación de los enfermos crónicos y permite nuevos tratamientos y oportunidades. Para Pedro Carrascal, miembro del Comité de Directores de la Plataforma de Organizaciones de Pacientes (POP): “Los datos son una oportunidad de hacer visible lo invisible. En enfermedades como la esclerosis múltiple hay multitud de síntomas que no se ven. Los data lakes y el manejo cada vez más detallado de la información permitiría ir más allá de las pruebas hospitalarias para integrar datos que dan una visión donde se tienen en cuenta la calidad de vida o los aspectos sociales o vitales y que ponen al paciente en el centro desde su condición de persona única e irrepetible”.

Pero las asociaciones de pacientes saben que la idea de compartir datos genera reticencias entre los usuarios de sistemas sanitarios. “Desde las asociaciones podemos impulsar que el paciente comparta sus datos y participe activamente en la creación de data lakes a través de la educación sanitaria para que vean la utilidad de estas plataformas”, añade Pedro Carrascal. Además, estas organizaciones se encargarían también de defender la elaboración de una normativa para la explotación de datos en salud sin menoscabar el derecho a la privacidad.

Sigue a Consumer en Instagram, X, Threads, Facebook, Linkedin o Youtube