En els últims anys, la renovació dels models de gestió sanitària s’ha convertit en una prioritat per molts països. Per fer-ho, s’ha apostat per la intel·ligència artificial com una de les eines clau que ajudarà a optimitzar l’atenció dels pacients i la prevenció de malalties. Però no es tracta d’un canvi sobtat del full de ruta. Amb el augment de la esperança de vida i els avanços de la ciència mèdica , es han creat els anomenats data lakes . A continuació et contem què és un data lake sanitari i les seves aplicacions més importants .
Què és un ‘data lake’ sanitari?
Els data lakes són uns repositoris centralitzats de dades en brut –sense estructurar ni classificar– que poden ser processats amb eines de big data . El seu objectiu és facilitar el flux d’informació, adequant la manera de classificar variables clíniques i, en definitiva, millorar la capacitat de prevenir, diagnosticar i tractar els problemes de salut.
Amb els Fons de Recuperació Europeus, Espanya afronta el repte de convertir al sistema sanitari en un ecosistema de coneixement integrat per fer visibles els mecanismes més desconeguts de la salut i la malaltia.
Més enllà de les històries clíniques
L’automatització de multitud de processos mitjançant la intel·ligència artificial és una constant en l’actualitat. Els data lakes es presenten com una solució per emmagatzemar enormes quantitats de informació que no estan estructurades ni filtrades . Una vegada guardats totes aquestes dades, el big data li farà un propòsit concret quan es consulta.
“Avui dia, la quantitat d’informació mèdica que es genera és molt abundant. Molta procedeix d’hospitals (proves de radiologia, laboratoris, tractaments) i altra dels nivells assistencials d’Atenció Primària, com urgències o les receptes electròniques. En medicina és important la contextualidad dels símptomes, per això el repte està en l’homogeneïtzació de tota aquesta informació”, explica Antonio Urda, traumatòleg i vicepresident d’Hospitals en Savana, companyia tecnològica especialitzada en data lakes sanitaris.
La captació i el magatzematge de informació fa lloc a dues menes de bases de dades :
- una primera, sense la informació personal dels pacients, però el gestor dels quals sí mantindria la capacitat d’identificar cada dada.
- una segona completament anònima, és a dir, sense possibilitat d’identificar als pacients que generen aquestes dades.
Per què serveix un ‘data lake’ sanitari?
“Contar amb una base de dades en la que es pugui contactar amb cada pacient és molt útil en els casos de alerta sanitària , per identificar alhora a totes les persones que podrien estar afectades sense necessitat d’acudir a moltes fonts d’informació diferents”, apunta el doctor Ordeixi, qui cita com exemple la detecció de fallades en lots de marcapassos , implants o pròtesis .
També pot ajudar per reclutar pacients per assajos clínics . “Per exemple, si hi ha un estudi obert, es pot acudir a aquesta base de dades per detectar a tots aquests pacients que han esgotat les seves diferents línies de tractament oncològic i podrien beneficiar d’aquesta nova línia de tractament”, afegeix Ordeixi.
Un altre cas de com pot ajudar un data lake sanitari l’aporta Sergio Cinza, director de l’Agència de Recerca de la Societat Espanyola de Metges d’Atenció Primària (SEMERGEN). “Sabem des de fa anys que els pacients amb psoriasis tenen més risc cardiovascular que altres malalts perquè hi ha un mecanisme inflamatori comú darrere de totes dues patologies que s’ha estudiat molt poc”, explica. Per intentar entendre aquesta relació, han posat en marxa l’estudi REPICA , que està reclutant en Atenció Primària a 102 pacients amb psoriasis per analitzar factors de risc cardiovascular, tractaments, si tenen o no malaltia cardíaca i el seu pronòstic per seguir-los durant cinc anys. “Disposar d’una plataforma de data lake ens permetria estalviar aquests cinc anys de estudi i augmentar el volum de participants a 2.000 per aconseguir una potència estadística suficient per identificar la mena de pacient amb psoriasis que té alt risc de desenvolupar una malaltia cardiovascular”, explica Sergio Cinza.
Pels experts, les conclusions de l’algorisme permeten anar més enllà de l’estadística clàssica, que suposa un avanç per els estudis sobre malalties estranyes , la baixa prevalença de les quals i dispersió dels pacients dificulten les prediccions i actuacions sobre l’evolució de les patologies.
Imatge : herbert11timtim
I si les dades són anònimes?
Contar amb una base de dades completament anònima permetria un canvi de paradigma en els estudis de recerca amb grans mostres de població. D’aquesta manera, es podrien emprar diferents variables de l’aprenentatge automàtic per anticipar en el temps amb més precisió els factors de risc que determinen moltes malalties.
També serviria per detectar en temps real noves epidèmies infeccioses i per entendre els seus processos de transmissió i millorar així la prevenció.
Per què es pot utilitzar?
Segons Savana, en resum, aquestes són les aplicacions dels data lakes :
- Estudis observacionals basats en la evidència de casos reals . Es pot aplicar a la recerca clínica de fàrmacs, de productes sanitaris o de protocols d’abordatge clínic o terapèutic.
- Reclutar pacients per assajos clínics . Els investigadors a càrrec d’aquests assajos poden accedir a la informació de possibles pacients de forma molt ràpida.
- Plataforma de visualització i anàlisi de dades . Aquesta informació estarà disponible pels centres i autoritats sanitàries, per la gestió de recursos o la presa de decisions.
- Models predictius . Per l’elecció guiada de tractaments (medicina personalitzada) o per anticipar la derivació a especialistes.
- Nous models de gestió sanitària . Fer seguiment de la nova tecnologia sanitària adquirida pels hospitals per saber si és efectiva o no.
De pacients a persones
La recerca basada en data lakes significa un canvi de situació de els malalts crònics i permet nous tractaments i oportunitats . Per Pere Carrascal, membre del Comitè de Directors de la Plataforma d’Organitzacions de Pacients (POP): “Les dades són una oportunitat de fer visible l’invisible. En malalties com l’esclerosi múltiple hi ha multitud de símptomes que no es veuen. Els data lakes i el maneig cada vegada més detallat de la informació permetria anar més enllà de les proves hospitalàries per integrar dades que fan una visió on es tenen en compte la qualitat de vida o els aspectes socials o vitals i que posen al pacient en el centre des de la seva condició de persona única i irrepetible”.
Però les associacions de pacients saben que la idea de compartir dades genera reticències entre els usuaris de sistemes sanitaris. “Des de les associacions podem impulsar que el pacient comparteixi les seves dades i participi activament en la creació de data lakes a través de l’educació sanitària perquè vegin la utilitat d’aquestes plataformes”, afegeix Pere Carrascal. A més, aquestes organitzacions s’encarregarien també de defensar l’elaboració d’una normativa per l’explotació de dades en salut sense menyscabar el dret a la privacitat.