鈥淒e opleiding leerde me anders denken en zien waar data science echt waarde toevoegt.鈥

Dave Hamersma

Dave Hamersma had al de nodige ervaring met data science toen hij begon aan de opleiding bij EAISI Academy. Voor zijn Master鈥檚 thesis in gezondheidswetenschappen aan de Universiteit Twente heeft hij van de uitkomsten van borstkanker behandelingen in Nederland en Noorwegen, waarbij hij gebruik maakte van federated learning (red: een techniek om berekeningen uit te voeren op decentraal opgeslagen data, zonder dat deze data worden gekopieerd). Daniel Kapitan (DK) sprak hem over zijn overwegingen om zich verder te verdiepen in het vakgebied en hoe hij zijn Mastering project bij EAISI Academy verder heeft ontwikkeld bij Sensire.

 

DK: Goed om je weer te spreken! Kan je om te beginnen vertellen hoe je in het werkveld van data science & AI in de zorg terecht bent gekomen? 

鈥淎ls ik terugkijk op mijn carri猫re tot nu toe, was het niet vanzelfsprekend dat ik data scientist zou worden. Na mijn MBO-opleiding  International Business Studies ben ik fysiotherapie gaan volgen.. Toen al vond ik vooral de onderzoekende vakken leuk. Tijdens de opleiding krijg je veel interessante en uitzonderlijke casu茂stiek te zien. In de praktijk bleek het werk als fysiotherapeut echter te repetitief en minder passend bij mijn interesses.  Daarom ben ik gezondheidswetenschappen gaan studeren. Daar kwam ik in aanraking met statistical learning en leerde ik de basis van machine learning in R. Het idee om via data science een bijdrage te leveren aan de zorgsprak mij aan en daar ben ik verder in doorgegaan.鈥 

 

DK: Hoe kwam je op het idee om de opleiding bij ons te volgen?

鈥淩edelijk snel na mijn opleiding ben ik gaan werken bij Sensire, een grote zorgorganisatie in de verpleging,  verzorging en thuiszorg. Toen ik daar begon, waren we vooral bezig om de basis op orde te krijgen: data uit bronsystemen ontsluiten, bedrijfsrapportages maken, dat soort zaken. Later besloten we om een nieuw, overkoepelend digitaliseringsprogramma te starten. Met de overstap  naar Google Cloud werd het een stuk makkelijker om meer met machine learning te doen. Dat was voor mij de aanleiding om me verder te verdiepen." 

 

DK: Toevalig was ik op dat moment bij Sensire betrokken als adviseur voor die cloud migratie.

"Dat maakte het voor mij wel makkelijk om te kiezen! Wat de opleiding voor mij aantrekkelijk maakte was dat ik horizontaal kon instromen in de Applications track. Mijn doel was om meer vlieguren te maken en meer vertrouwen te krijgen in het zelfstandig uitvoeren van  end-to-end projecten.  Hoewel ik veel van de oefenopdrachten al kende, kreeg ik nu veel meer feedback op mijn werk, wat zorgde voor veel meer verdieping.We gingen ook veel verder dan alleen een scriptje schrijven om een model te trainen. Ik herinner me dat Pieter Overdevest (red: een van de docenten) tijdens een werkcollege de vraag stelde: 鈥楢ls je eenmaal een model hebt getraind, wat ga je er dan mee doen?鈥 Dat heeft mij aangespoord om mij verder te verdiepen in verschillende aspecten van data en software engineering, om AI systemen daadwerkelijk in gebruik te nemen en te beheren." 

DK: Wat vind je van het engineering gedeelte? Ik zie vaak dat deelnemers vooral gericht zijn op machine learning zelf, 鈥榯he sexiest job of the century', en veel minder op engineering.

鈥淚k vind het juist leuk om er iets van te maken, dus verder te gaan dan alleen de scripts schrijven voor het trainen van de modellen. Voor mijn Mastering project heb ik een samenvattingstool ontwikkeld, waarbij ik verschillende LLMs (Large Language Models) heb vergeleken om te zien welke het beste verpleegkundige verslagen in het Nederlands kan samenvatten. Het was wel grappig dat ik in het kader van deze opdracht, op kosten van Sensire, een GPU kon aanschaffen en daarmee mijn eigen gaming computer kon upgraden. Dus ja, dat engineeren vind ik wel leuk." 

DK: Er gaat geen dag voorbij of we lezen weer over een nieuwe toepassing van LLMs. Kan je meer vertellen over jouw project en wat je daarvan hebt geleerd? 

鈥淚k vind het inderdaad ongelooflijk hoe snel die ontwikkelingen gaan, en dat maakt mijn werk ook leuk. In mijn onderzoek heb ik eerst gekeken naar het schrijven van goede prompts, om te voorkomen dat in de samenvattingen gekke hallicunaties verschijnen. Tijdens een van de experimenten die ik deed, kwam ineens in de samenvatting een zin te staan dat de client 鈥渧eel over God praat en erg gelovig is鈥. Dat stond werkelijk nergens in de oorspronkelijke teksten! Een ander voorbeeld is dat de LLM makkelijk links en rechts door elkaar haalt. Als in het dossier staat dat een persoon bijvoorbeeld net is geopereerd aan de linkerknie kan opeens in de samenvatting staan dat dat de rechterknie is. Het goed tunen van deze modellen is essentieel voor praktisch gebruik. In dit geval heb ik ook veel tijd besteed om in overleg met collega鈥檚 van verpleegkundige een goede test dataset aan te leggen, zodat we de kwaliteit van de gegenereerde samenvatting konden meten. Dat is eigenlijk nog steeds lastig, want hoe beoordeel je eigenlijk objectief de kwaliteit van een samenvatting? Daar ga ik nog verder onderzoek naar doen.鈥 

 

DK: Hoe heb je het samenvattingssysteem uiteindelijk in productie gebracht? 

鈥淣a mijn afstuderen heb ik verschillende versies ontwikkeld en gekeken hoe we het zo simpel mogelijk konden integreren in een webbrowser. In november 2024 is SensAI echt live gegaan. We hebben uiteindelijk gekozen voor Google Gemini 2.0 als foundational model, omdat dat de beste resultaten gaf en ook goed integreerde met ons dataplatform. 鈥 

 

DK: Gefeliciteerd! We weten allemaal hoe uitdagend het is om machine learning project echt in productie te krijgen. Heb je nog tips voor toekomstige deelnemers?

鈥淒e opleiding heeft mij vooral een nieuwe manier van denken geleerd: waar kun je data science toepassen en waar heeft het nut. Voor mij was het natuurlijk gaaf om mee te surfen op de GenAI golf die gaande is, maar de kennis en vaardigheden die ik heb gedaan gaan veel verder dan dat.鈥