Krijg je de data niet naar het algoritme, breng het algoritme dan naar de data

abstract digi algotirmen IT-woordkunstenaars

Diverse onderzoeksprojecten en pilots hebben ruimschoots aangetoond hoeveel inzichten je kunt halen uit het combineren van verschillende soorten patiëntdata in verschillende bronnen. Nu zien ziekenhuizen zich gesteld voor de volgende uitdaging: hoe krijgen ze al die data bij elkaar? Kan het slimmer, door niet de data te laten ‘reizen’, maar het algoritme?

De hoeveelheid digitale data die ziekenhuizen van hun patiënten opslaan groeit snel. Steeds meer informatie die vroeger alleen analoog beschikbaar was, is nu gedigitaliseerd. Sommige van die data betreffen beelden op extreem hoge resolutie, wat veel opslagcapaciteit vergt.

Ziekenhuizen kunnen al die data niet meer op hun eigen servers opslaan. Ze ontkomen niet aan gebruik van de cloud en doen daarbij vaak een beroep op de clouddienstverlening van hun technologieleveranciers. Op die manier blijven de kosten beperkt en de omgeving beheersbaar. Dit levert wel nieuwe uitdagingen op omdat data dan in verschillende silo’s staan. Artsen kunnen de beelden wel centraal inzien via een viewer in het EPD, maar ze kunnen niet de data in samenhang laten analyseren door een algoritme.

Een AI-algoritme loslaten op data binnen één applicatie is wel mogelijk, zoals het laten beoordelen van een mammografie op de aanwezigheid van borstkankercellen. Maar een analyse loslaten op verschillende typen data, zoals leeftijd, gewicht, bloeddruk, een MRI-scan, een coupe die is gesneden van een biopt en bepaalde bloedwaarden, dat kan niet. Er zijn technische problemen zoals de vereiste bandbreedte en opslagcapaciteit om data naar een centrale plek te halen, maar er zijn ook privacy-issues. Sommige van de data staan misschien niet in het EPD van het ziekenhuis, maar in het HIS van de huisarts, het systeem van de fysiotherapeut of het EPD van een ander ziekenhuis waar de patiënt eerder diagnostiek of een behandeling heeft ondergaan.

Treinen, spoorlijnen en stations

Om deze problemen te omzeilen, kwam een groep onderzoekers met het concept: als we de data niet naar het algoritme kunnen brengen, waarom brengen we het algoritme dan niet naar de data? Om duidelijk te maken hoe dit werkt, bedacht de groep de metafoor van treinen die via spoorlijnen naar stations rijden. Ze noemen het concept Personal Health Train (PHT). De stations zijn de plekken waar data staat. Dit kunnen enorme databases in klinieken zijn, maar ook kleine applicaties waarmee patiënten zelf hun eigen data verzamelen, zoals een gezondheids- of sportapp op een smartwatch. De stations geven aan wat een langskomende trein met de data mag doen. Dat kan variëren van ‘niemand mag iets met deze data doen’ tot ‘iedereen kan dit data-element gebruiken’. De treinen zijn de workflows met vragen en de algoritmen die worden gebruikt voor data-analyse. De spoorlijnen tot slot zorgen ervoor dat de algoritmen en vragen op een veilige manier bij de data komen. Ofwel: de spoorlijn zorgt ervoor dat er interactie kan plaatsvinden Dit concept geeft artsen, maar ook onderzoekers op een gecontroleerde manier toegang tot heterogene databronnen, terwijl tegelijkertijd de privacy is gegarandeerd, omdat patiënten en burgers zelf kunnen aangeven welke data ze voor welke doeleinden beschikbaar stellen. PHT maakt gebruik van twee principes: data moet FAIR zijn (zie kader) en de data blijft waar die is.

Breed toepasbaar

PHT is ontwikkeld door mensen die onderzoek willen doen op grote, gedistribueerde datasets en wordt ondersteund door Health RI (Research Infrastructure), een publiek-private samenwerking van meer dan 70 organisaties in Nederland die betrokken zijn bij onderzoek. Maar het concept leent zich ook prima voor het bepalen van de beste behandeling voor een individuele patiënt. Een arts kan bijvoorbeeld een treintje op pad sturen dat uitzoekt hoe succesvol behandelopties in het verleden waren bij patiënten die lijken op deze patiënt. Daarnaast kan de infrastructuur van de PHT worden gebruikt om data van het ene naar het andere ziekenhuis te verplaatsen. In dat geval bevat het treintje geen onderzoeksvraag of algoritme, maar patiëntdata. Daarmee ontwikkelt PHT zich van een infrastructuur die primair wordt gebruikt voor onderzoek naar kanker naar een breed toepasbare zorginfrastructuur. Ook buiten de zorg bestaat interesse voor dit concept.

Omslag in denken

Het concept van de PHT zorgt voor een grote omslag in het denken over onderzoek op grote datasets. Waar het tot voor kort gebruikelijk was om eerst de data bij elkaar te brengen, realiseren artsen en onderzoekers zich nu dat ze research kunnen doen op gedistribueerde datasets. Daarmee bereiken ze zowel een hogere privacybescherming als toegang tot meer data. Bovendien is geen separate breedbandinfrastructuur zoals XDS nodig, want de hoeveelheid data die verplaatst moet worden is heel beperkt.

Meer weten? Neem dan een kijkje op de communitypagina: pht.health-ri.org

Lees ook:

Gerelateerde berichten...

X