Kenniswerkers hebben veel baat bij goed gestructureerde gegevensbestanden. Die stellen hen in staat om in luttele seconden informatiebrokjes op te diepen en met elkaar in verband te brengen. Medici geven voornamelijk in tekstuele vorm expressie aan hun kennis en bevindingen. Een behandelaarmoet eerst lange lappen tekst lezen om zich een oordeel te vormen. De vraag is terecht of de unieke kennis van een medisch specialist zich niet op een efficiëntere manier laat gebruiken.
Onder invloed van de digitalisering in de zorg, gaat inmiddels 35% van de productieve tijd van medische specialisten op aan registratieve taken.Het inkloppen van gegevens door hoog opgeleide medici is zonde van de tijd. De digitalisering van de informatievoorziening in ziekenhuizen heeft bijna altijd een tweeledig doel: efficiency verhoging en kwaliteitsverbetering van de zorg. Het eerste doel is met een stopwatch in de hand te meten tijdens de uitvoering van zorgprocessen. Het tweede doel hangt samen met hoe de patiënt uit het zorgproces is gekomen.Heeft een behandeling het gewenste effect gehad of is de gezondheid van de patiënt alleen maar verslechterd?
Aanwijzingen daarvoor vinden we niet altijd terug in het elektronisch patiënten dossier. Maar we treffen die wel in tekstuele vorm aan in de ontslagbrieven, diagnoseverslagen en verpleegkundige logboeken.Tekstuele data is ongestructureerd en zit daarom niet in een EPD, waarin alleen plaats is voor gestructureerde data. Onder invloed van de ontwikkelingen in de consumenten IT is via de mobieltjes en tablets de aanwas van ongestructureerde data fors toegenomen. De dominante digitale conglomeraten als Google, Apple en Microsoft verzamelen die data door middel van Big Data technologie. Consument gerichte marketeers behoeven niet langer te zoeken. Zij weten alles van hun doelgroepen.
In de zorg is het data volume niet zaligmakend. Het gaat om het juiste gegevenselement, relevant bij een bepaalde behandeling. ’Little data’ spoorwicht te zoeken naar gemeenschappelijke kenmerken van patiëntgroepen met verder volstrekt individueel afwijkende typeringen. Dit soort informatie haal je uit ongestructureerde, vrije tekst waarin specialisten maar ook verplegers hun bevindingen noteren.
Met iKnow, een softwareproduct voor tekstuele analyse, wijst InterSystems de weg naar een kwalitatieve methodiek om alle relevante informatie te verzamelen en te structureren in concepten en onderlinge relaties. In veel gebruikelijke text mining oplossingen zoals in zoekmachines wordt ’fuzzy logic’ toegepast , waarbij alleen kwantiteit de relevantiewaarde kenmerkt. Vanuit een topdown benadering worden termen herkend die vooraf zijn gedefinieerd volgens tekstindelingen, gangbaar in thesauri en ontologieën. Om fatale fouten te vermijden moet dat proces van definiëren vooraf geschieden en wel voor de gehele set aan complexe (relevante) termen. Bovendien laten van die complexe termen alleen delen zich detecteren. Je moet het proces dus meermalen uitvoeren voordat het gehele tekstbestand is geïndexeerd. Dat kost tijd. Bij een uitdijende databerg is via een topdown benadering het werk niet meer door kenniswerkers bij te benen. Bij de bottom-up benadering van iKnow vindt indexering plaats op basis van de herkenning van alle complexe termen in een tekstbestand. De lengte van de woordgroepen speelt geen rol. De kwalitatieve aspecten van het zoek- en indexeringsproces staan voorop.
Signalen in dossiers
Onze partner Praktijk Index uit Bilthoven heeft onze text mining software gebruikt in een experimenteel onderzoek,waarin het verpleegkundige dossier van twee ziekenhuizen werd onderzocht. Bij de één lag de focus op het vinden van signalen in verpleegkundige dossier over het ontstaan van een delier bij oudere patiënten tijdens een opname. Bij de andere instelling wilde men meer inzage in de plotseling verslechtende gezondheid van sommige oudere patiënten tijdens de opname. Ondanks het feit dat de data wetenschappers van slecht 3.000 waarnemingen tot hun beschikking hadden, presteerde het iKnow model verrassend goed. Aan de hand van specifieke woorden in het verpleegkundige dossier was redelijk goed te voorspellen of iemand een delier had gehad of onverwacht op de IC was terechtgekomen.
Praktijk Index werkt in feite alleen met anonieme gegevens. De data verlaat het ziekenhuis niet. Er zijn heel wat personen die patiëntendossiers kunnen inkijken voor bijvoorbeeld onderzoek of medische codering. Het is theoretisch mogelijk dat zij wel eens het dossier tegenkomen van iemand die zij kennen. Een computer herkent niemand zolang die daarvoor niet is geprogrammeerd. Vanuit het oogpunt van privacy is een computer veiliger dan een mens. Eens anoniem gemaakt, kan ’gevoelige’ medische informatie ook het ontwikkelingsproces van geneesmiddelen verrijken en versnellen. Er is bijna 5 miljard dollar gemoeid met het op de markt brengen van een nieuw geneesmiddel, vanwege de lange tijd waarin een medicijn een klinische test ondergaat. InterSystems participeert actief in een Europees project om die medicijn ontwikkeling te versnellen met behulp van analyses op geanonimiseerde patiëntendata. De gereedschappen zijn er. De data wetenschappers willen ze toepassen. Het is nu aan de beleidsmakers in de zorg om te faciliteren.
Herman Roelandts,
Country Sales Manager InterSystems Benelux