NLP, what’s in a name?
Eerst en vooral wat is Natural Language Processing, of kortweg NLP? Om je hier iets bij voor te stellen, denk je best aan Google Translate; software die in staat is om een tekst in een bepaalde taal te begrijpen en te vertalen in een andere taal. Dit is mogelijk dankzij NLP waarbij artificiële intelligentie (AI), computationele taalkunde en computerwetenschappen gecombineerd worden om de interactie tussen computers en menselijke taal te bestuderen.
NLP gaat al even mee. De eerste toepassing dateert van 1950 waarbij Russische zinnen naar het Engels werden vertaald. Zoals jullie wel weten, leiden te letterlijke computervertalingen soms tot hilarische zinnen. Zo werd ‘The spirit is willing but the flesh is weak’ in het Russisch vertaald en dan terug naar het Engels wat dit als resultaat gaf: ‘The vodka is good but the meet is rotten”.

Ook bij de nieuwere versie van Google Translate zijn de vertalingen nog niet 100% accuraat ;). Het loopt vaak mis door een gebrek aan context. De betekenis van woorden is namelijk afhankelijk van de context. Sinds 1950 ging NLP met rasse schreden vooruit dankzij een aantal ontwikkelingen:
Extraction vs Abstraction gebaseerde samenvatting
Als een samenvatting van een stuk tekst wordt gemaakt, kan dat via het extraheren (extraction methode) van de belangrijkste segmenten uit een tekst (bijv. zinnen, kernwoorden) of via het herschrijven in eigen woorden (abstraction methode). Bij de abstraction methode is het gevaar minder groot dat de context verloren gaat, maar die methode is complexer om te automatiseren.
Sentiment analyse
Bij sentiment analyse wordt subjectieve informatie uit de tekst gehaald zoals opinies, beoordelingen, emotionele status. Op die manier kunnen bijvoorbeeld restauranthouders nagaan of de geschreven reviews voornamelijk positief, neutraal of negatief zijn.
Tekst classificatie
Een eenvoudig voorbeeld van het classificeren van tekst volgens voorafbepaalde categorieën is de spam detector in je mailbox; deze bepaalt welke mails spam zijn en welke niet. Een complexer systeem is ‘auteur attributie’ waarbij op basis van de stijl van de tekst kan bepaald worden welke auteur het stuk geschreven heeft.
Het bijzondere aan NLP is dat het wereldwijd wordt toegepast in verschillende applicaties zonder dat je het goed en wel beseft. Enkele voorbeelden zijn grammatica checks in word, events in je mailbox die automatisch in je agenda worden geplaatst, Apple’s Siri, content-based advertising… Iets uitdagender zijn de experimenten waarbij robots met elkaar in conversatie gaan (zie video).
Wat kan NLP nu in de gezondheidszorg betekenen?
Iedereen kent de grote speler IBM Watson wel. Die is ondermeer bekend van het spel Jeopardy waarbij Watson’s supercomputer de menselijke tegenstander versloeg. De IBM Watson Health division zet de NLP technologie in om de gezondheidszorg vooruit te helpen. Aangezien er ondertussen honderdduizenden wetenschappelijke artikels zijn over de diagnose en behandeling van kanker, is het onmogelijk voor een arts om al deze artikels te lezen EN alle info vervolgens te onthouden. Laat staan dat zij vervolgens on the spot concrete adviezen kunnen formuleren over de beste kankerbehandeling voor een bepaalde patiënt. IBM Watson’s technologie kan de arts hierbij assisteren door alle medische journals in een recordtempo te scannen en zo voorstellen te doen met betrekking tot diagnose en behandeling.
Maar ook in België wordt druk aan de weg getimmerd. Zo werd eind 2015 Lynxcare Clinical Informatics opgericht door apotheker Georges De Feu en arts Dries Hens. Zij ontwikkelden met behulp van NLP en AI, software die medische gegevens efficiënt en automatisch registreert en ter beschikking stelt van de arts met als doel optimalisatie van de zorg. Aan een snel tempo worden (ellenlange) medische dossiers doorgenomen waarbij ongestructureerde informatie (uit bijv. doktersbrieven) geanalyseerd wordt. Concreet betekent dit dat men niet langer manueel op zoek moet gaan naar informatie in medische dossiers, maar dat men deze informatie automatisch kan extraheren. Zo kan men bijvoorbeeld snel de complicaties in kaart brengen bij duizenden patiënten die een hersenoperatie ondergingen en vervolgens mogelijke verbanden onderzoeken met type operatie.
Het is natuurlijk steeds belangrijk dat NLP contextuele informatie begrijpt zoals wij dat als mens kunnen. Als er in een doktersverslag staat dat de patiënt zijn grootvader 10 jaar geleden kanker heeft gehad, mag die kanker niet als alleenstaand feit gezien worden, want dan zou deze foutief kunnen gekoppeld worden aan de patiënt. De contextuele NLP wordt steeds beter en verfijnder naarmate er meer data door de NLP software verwerkt worden.
Het voordeel van het gebruik van NLP technologie in de gezondheidszorg is de grote hoeveelheid real world evidence data die kan worden verzameld. Enerzijds, kunnen deze data gebruikt worden om de artsen/zorgverleners sneller inzichten te geven om hun zorg te optimaliseren. Anderzijds is dit zeer waardevol om op grote schaal onderzoek te doen en bijvoorbeeld te bepalen welk type behandeling effectief leidt tot betere resultaten. Een samenwerking tussen universiteiten/ziekenhuizen en bedrijven die deze NLP technologie in huis hebben, kan dus zeer interessant zijn wanneer men grote hoeveelheden data verwerkt.
____________________________________________
” Natural Language Processing kan grote hoeveelheden data verzamelen die zorgverleners helpen om hun zorg te optimaliseren en aangeven welk type behandeling leidt tot betere resultaten “
____________________________
Binnenkort vertrek ik opnieuw naar San Francisco om me verder te verdiepen in de rol van NLP in de gezondheidszorg, dit met de steun van de Koning Boudewijn Stichting. Vanaf oktober zal ik dus vanuit de US bloggen in het Nederlands of Engels, who knows ;). Stay tuned!
Elke