Informazioa bildu, aztertu eta tratatzeko big data medikuntzan aplikatzeak gaixotasunak ikertzeko, prebenitzeko eta tratatzeko paradigma-aldaketa ekarriko du. Espainiak data lake edo datu-laku bat sortzea aurreikusi du, herrialdea ikerketaren abangoardian jartzeko. Proiektu aitzindari hori zertan datzan aztertuko dugu, eta Txina, Erresuma Batua edo Estatu Batuen proposamenak ikusiko ditugu, Europako ideiaz gain.
Espainiako ‘data lake’ sanitarioa
Testuinguru horretan, Espainiako Gobernuak, Errekuperazio, Eraldaketa eta Erresilientzia Planaren bidez, 100 milioi euro bideratuko ditu herrialde oso bateko osasun-datuak biltzen dituen munduko lehen data sortzeko. Proiektu horretarako, adituek historia kliniko elektronikoa aipatzen dute. Tresna horrekin, Espainia aitzindaria izan zen munduan, Europako herrialde gehienekiko indar nagusitzat hartuta, historia klinikoak paperean erregistratzen jarraitzen baitute.
Proiektu hau machine learning (ikaskuntza automatikoko tresnak) delakoan oinarrituko da, adimen artifizialaren barruko azpi-diziplina horretan, hau da, makinek algoritmoaren bidez ondorioak ateratzeko duten gaitasunean. Espainiako osasun-sistemaren kasuan, machine learning-ari esker, historia klinikoetako datuak prozesatu ahal izango dira iragarpenak egiteko, hala nola, gaixo bati eman aurretik tratamendu bat izateak duen eragina, akatsen eta zabarkeriaren probabilitateak murriztuz, arrisku-faktoreak detektatuz eta diagnostikoak eginez.
Bildutako informazio guztia prozesatzeko, Lengoaia Naturalaren Prozesamendua (PNL) erabiliko da. Baliagarria da, bai dokumentu medikoetatik abiatuta datu-baseak eraikitzeko, bai historia klinikoen identitateari buruzko informazioa automatikoki detektatu eta ezabatzeko, datu anonimoen multzoak sortzeko. Azken finean, osasun-sistema ikertzaileekin eta gizarte-eragileekin integratzetik sortutako ekosistema berri bat da, osasuna eta gaixotasuna hobeto ezagutzeko.
Beste esperientzia batzuk munduan
Espainiako proiektua aitzindaria da, baina adimen artifiziala aspalditik erabiltzen da mundu osoko hainbat proiektutan. Herrialde industrializatuetako osasun-erakundeek darabiltzaten datu-bolumen handiek joera berri bat zabaldu dute sektorean: Ο-based Healthcare (balioan oinarritutako osasun-arreta), ezagutza trukatzeko gai diren informazio-sistemek gaixoari ematen dioten balioan oinarritutako paradigma.
Proiektu garrantzitsuenetako bat Txinan 2017an hasitako proiektua da. 280 milioi datu biltzen ditu, National Scientific Data Sharing Platform for Population and Health (NSDSPPH) delakoak, biomedikuntza, oinarrizko medikuntza, medikuntza klinikoa, osasun publikoa, medikuntza tradizional txinatarra, farmakologia, populazioa eta ugalketa-medikuntza kategorietan.
Bestalde, EEn. AEB Lakes datek medikuntza pertsonalizaturako proiektu asko bultzatzen dituzte une honetan. Horietako bat Arizonako ospitale batean egindakoa da. Adimen artifizialean oinarritutako proiektu bati esker, zenbait sendagairen erabilerak eragindako giltzurrun-lesioak monitorizatu ahal izan dira, eta, hala, algoritmo bat garatu ahal izan da, botika horiek beste modu batera dosifikatzeko, kontraindikazio horiek saihesteko.
Erresuma Batuak ere baditu arlo horretako proiektuak, hala nola DataLoch. Proiektu hau Edinburgon garatu da, eta hiru iturritan (osasun publikoa, osasun pribatua eta zainketa-elkarteak) integratutako informazioa trukatzean eta gurutzatzean oinarritzen da. Pandemiaren ondoren sortu zen, eta helburua ikerketa eta berrikuntza sustatzea da, datuak erabiliz.
Europako erantzuna: oinarri bakarra
Data lake sanitarioa bezain garrantzitsua da pribatutasun-eskubideak eta datuen babesa bermatzen dituen arau-esparruan garatzea. Bruselatik eskualdeen arteko osasun-datuen banaketa kentzearen alde egiten du, muga sanitarioak ezabatuz.
Herritar batek Europako edozein farmaziatan sendagai arautua eskuratu ahal izatea du helburu, prozedura burokratikorik erabili gabe, eta hori dagoeneko posible da Finlandiaren eta Esloveniaren artean.
Horretarako, EBko estatuek 2018an Europako Osasun Datu eta Ebidentzien Sarea (EDHEN) plazaratu zuten, 2024an datu handien sare federatu bat sortzeko, Europako 100 milioi datu mediko estandarizatzeko. Horretarako, eredu bat ezarri zuten, eta, eredu horren arabera, datu-base guztiak modu berean egituratu eta etiketatu behar dira, ikertzaileek aldi berean datu-galdera bera bidal dezaten. Adibidez: “Sendagai-mota jakin bat hartzen duten 55 urtetik gorako zenbat pertsonak garatu dute konplikazio kardiobaskularra azken 12 hilabeteetan?”