UMagazine artikel

Data Science: sleutel naar een betere wereld

Annelotte Huiskes (text) and Sasha Ruland (photography)
Michel Dumontier UM Magazine

Volgens de Europese Commissie neemt de hoeveelheid data die de wetenschap produceert elk jaar met een derde toe. Hoe kun je als wetenschapper in die berg aan data je weg nog vinden? Dat is nu precies waarnaar de nieuwe universiteitshoogleraar Data Science Michel Dumontier onderzoek doet. De 41-jarige Canadese toponderzoeker komt van de gerenommeerde Stanford University waar hij zich vooral bezighield met het ontdekken van nieuwe geneesmiddelen en precisiegeneeskunde.

Toen Michel Dumontier gevraagd werd om als universiteitshoogleraar in Maastricht een interdisciplinair instituut voor data sciences op te zetten, hoefde hij niet lang na te denken. Dat was precies wat hij wilde. “Om de wereld te veranderen moet je samenwerken. Het is uniek wat Maastricht voor ogen heeft. Nergens ter wereld vind je zo’n interfacultair instituut voor data science.”

‘Aha’ moment

Ruim tien jaar geleden was een datawetenschapper vooral een zeer technisch opgeleide computer- programmeur. Nu, met alle software die inmiddels is ontwikkeld, is het volgens Dumontier vooral ook iemand die de juiste vragen weet te stellen. “Als je weet welk probleem je wilt oplossen, dan weet je welke data je nodig hebt.” Dumontier bijvoorbeeld heeft nooit een computeropleiding gehad. Hij is opgeleid als biochemicus en heeft zichzelf leren programmeren. Als jongetje van vijf kreeg hij zijn eerste computer en was meteen verkocht. Zijn moeder moest hem regelmatig achter het beeldscherm vandaan trekken om buiten te gaan spelen. Maar zijn vader was net zo enthousiast; computers hadden volgens hem de toekomst.

Samen met zijn broertje speelde hij eindeloos videogames. Toch koos hij voor een studie biochemie omdat hij ook altijd al geïnteresseerd was in natuurwetenschappen. Pas tijdens zijn PhD koos hij definitief voor de computer. “In het begin was het programmeren heel frustrerend, maar op een gegeven moment had ik het te pakken. Ik leerde hoe ik kon communiceren met de computer, hoe ik de computer dingen kon laten doen die ik wilde. Toen ik eenmaal wist hoe ik mijn gedachten kon vertalen naar de computer, realiseerde ik me dat ik de computer alles wat in mijn hoofd zat, zou kunnen laten doen. Dat was een enorm aha-moment.  Het is een methodologisch gedreven creatief proces. Toen ik dat eenmaal ontdekte heb ik nooit meer terug gewild naar de biochemie. Biologisch onderzoek is eigenlijk heel moeilijk, de ene dag doe je een experiment met bepaalde uitkomsten. Een dag later doe je hetzelfde experiment en zijn de resultaten heel anders. Het is dan moeilijk te achterhalen waar dit aan ligt. Heb ik iets fout gedaan, of waren de resultaten vanaf het begin af aan onjuist? Als een computerprogramma niet werkt, kan het alleen maar jouw fout zijn en die kun je herstellen. Dat vind ik zo fijn.”

Empowering

Het is juist dit, zoals hij het noemt, ‘empowering’ aspect van data science, dat hij zou willen overbrengen op zijn studenten. “Het is mijn hoop en overtuiging dat wanneer we studenten en zelfs middelbare scholieren leren op basis van gedegen data-onderzoek een probleem uit hun omgeving te analyseren, ze kunnen komen tot creatieve oplossingen en adviezen voor beleidmakers en bestuurders. Als je eenmaal de basisvaardigheden van data science onder de knie hebt, kun je elk willekeurig probleem aan. Van bijvoorbeeld de impact van immigratie tot de gevolgen van vergrijzing hier in Limburg.”

Knowledge graph

In Stanford ontwikkelde Dumontier een manier om biomedische data zodanig aan elkaar te koppelen dat uit die berg aan informatie voorspellende analyses gehaald kunnen worden. “We hebben een netwerk gebouwd, wat we in vaktermen een knowledge graph noemen, dat opgebouwd is uit data op individueel moleculair niveau en via informatie over chemische samenstellingen, genen en eiwitten, oploopt tot geografische data over populaties van over de hele wereld. Vervolgens hebben we een set aan methodes ontwikkeld die niet alleen antwoorden op vragen geeft, maar ook verbindingen blootlegt die verborgen zijn. Bijvoorbeeld dat een medicijn dat nu voor een bepaalde ziekte gebruikt wordt, ook blijkt te werken voor een andere ziekte zonder dat iemand daar ooit aan heeft gedacht.”

Standaard

Wat maakt zijn methode zo bijzonder? “In principe niets, er zijn vele manieren om data met elkaar te verbinden, maar waar het om gaat is om te komen tot een soort van standaardopslag en bewerking van data. Als er een standaard is kunnen data maximaal benut en hergebruikt worden door anderen. En dat is wat je wilt, want hoe meer data door iedereen gebruikt kunnen worden, hoe beter je onderzoek kunt valideren en hoe groter de kans dat er oplossingen op belangrijke problemen gevonden worden. Een voorbeeld: Waarom is het internet zo succesvol? Daarvoor waren twee technische tools nodig: TCP/IP, een manier om informatie door een netwerk te transporteren en HTML, een manier om inhoud op een pagina te zetten zodat het gerenderd kon worden door een browser. Omdat dit nu standaard is geworden, heeft iedereen slechts één browser nodig om het web aan data te kunnen zien. Maar stel dat er geen standaard  was, dan zou je een miljoen browsers nodig hebben om al die verschillende pagina’s te kunnen lezen. Tcpip en html hebben gezorgd voor een uniforme manier van uitwisselen en weergeven van informatie. Mijn groep richt zich op wat minimaal nodig zou zijn om al die verschillende wetenschappelijke data op een uniforme manier toegankelijk te maken. Die technologie hebben we ontwikkeld en willen we verder uitbouwen.”

Verbindend

En dat is precies wat er hier in het Instituut voor Data Science, voorlopige werktitel: IDS@UM,  gaat gebeuren. “Het biedt mij gelegenheid om te kijken of mijn methode ook werkt bij de data hier en niet alleen bij de biomedische data van Stanford. Het instituut moet een verbindende plek worden. We zullen niet alleen nauw samenwerken met DKE, maar met datawetenschappers uit alle disciplines. Van economie, humanities tot life sciences en gezondheid zodat verschillende methodes en applicaties gedeeld kunnen worden.

Michel Dumontier DKE UM magazine

Wij willen al die datawetenschappers die nu in hun eentje binnen de UM bezig zijn een thuis bieden en een goede academische omgeving creëren: wat zijn de laatste ontwikkelingen? Wat werkt het best? Kunnen econometrische methoden ook gebruikt worden voor gezondheid en vice-versa? Kunnen ontdekkingen uit het ene domein ook in een ander domein gebruikt worden?” Dumontier denkt niet in het klein. Uiteindelijk hoopt hij dat universiteiten wereldwijd mee zullen doen. “Als je de wereld wilt veranderen, kun je dat niet alleen doen. Zou het niet geweldig zijn als een arts je vanaf dag één de juiste behandeling kan geven, toegesneden op jouw individuele kenmerken. Dat willen we toch allemaal?”

Privacy

Privacy is in zijn vakgebied natuurlijk een groot issue, zeker in de medische wetenschap. “Ik denk dat het grootste probleem is dat men bang is dat de informatie die je geeft tegen je gebruikt zou kunnen worden. Maar de oplossing is niet om die informatie dan maar niet te delen. Mijn oplossing zou zijn regels en wetten op te stellen zodat degene die jouw informatie misbruikt gestraft kan worden.

Een van de belangrijkste redenen waarom medisch onderzoek zo langzaam vooruit komt, heeft te maken met het slecht toegankelijk zijn van medische dossiers. Ik ben er niet voor om barrières op te werpen voor data. Er zijn veel meer mensen die goede dingen met die data willen doen, dan slechte. Dus laten we de goede niet straffen.”

Verhuizing

Dumontier is samen met zijn partner al op zoek naar een huis in Maastricht. Hij heeft haar in Stanford ontmoet waar zij als internist stage liep bij biomedical informatics. “We delen de interesse voor informatics.” Een verhuizing van de Verenigde Staten naar Europa is voor hem geen enkel probleem. Zijn vader was vertegenwoordiger en door zijn werk moesten ze vaak verhuizen. “Ik ben geboren in Winnipeg , daarna woonden we onder meer in Woodstock Ontario, Montreal en Thunder Bay, waar ik naar de middelbare school ging. Mijn thuis is waar ik ben en dat is nu dus Maastricht, een van de mooiste steden die ik ooit heb gezien trouwens.”

Konijnen

Eenenveertig jaar, met een dijk van een carrière. Betekent dat dat hij alleen maar werkt? “Nee hoor, ik houd me aan de standaardwerkuren per dag. Een heleboel mensen denken dat als je meer uren draait, je productiever bent. Ik ervaar juist het tegendeel. Als je meer tijd neemt om na te denken, ben je meer effectief in de dingen die je doet.” En wat doet hij dan om af te schakelen?

“Twee dingen: ten eerste, ik heb een konijn. Zij is van Canada mee naar Amerika verhuisd en ze zal ook mee naar Maastricht komen. Ze is waarschijnlijk het meest bereisde konijn ter wereld”, zegt hij lachend. “Zeven jaar oud is ze. Ik had ook een mannetje, maar die is onlangs overleden. Dus ik kijk ernaar uit om hier een paar nieuwe konijnen uit te zoeken. Kijken naar konijnen maakt me heel rustig, je leert hun wezen kennen. Het zijn intelligente beesten met enorme persoonlijkheden. Het helpt me mijn hoofd leeg te krijgen en gewoon te ontspannen.  Ten tweede videogames; daar kan ik uren mee bezig zijn. Andere mensen hebben hobby’s of sporten, ik houd van gamen. Het biedt me de gelegenheid totaal anders te denken. Het is niet zozeer verslavend als wel therapeutisch. Ik ben er erg goed in en het is zeer ontspannend en lonend om iets te doen dat je goed kunt.”

Michel Dumontier (1975) was associate professor of Medicine (biomedical informatics) aan Stanford University van 2013 tot 2016. Hij promoveerde in 2004 aan de universiteit van Toronto in de biochemie. Van 2006-2013 was hij universitair (hoofd)docent op de Carleton University in Ottawa. Hij bekleedt vele nevenfuncties waaronder sinds 2016 het voorzitterschap van de AMIA Knowledge Representation and Semantics Working Group  en sinds 2010 is hij wetenschappelijk directeur van Bio2RDF, een open source project dat linked data voor life sciences creëert en bij elkaar brengt. Van af 1 januari 2017 is hij universiteitshoogleraar Data Science aan de Universiteit Maastricht.

Lees ook

  • Wat betekent het om te wonen, werken, ondernemen en leven in een stad en regio met een internationale universiteit. Wat merk je ervan en wat heb je er eigenlijk aan? We vroegen het aan Marcell Ignéczi. Hij kwam naar Zuid-Limburg om te studeren aan het Department for Knowledge Engineering van de...

  • Als patiënt in een ziekenhuis zie je dagelijks veel verschillende gezichten aan je bed: een verpleegkundige die je bloeddruk meet, een arts of verpleegkundig specialist die jou informeert over het zorgplan en een voedingsdeskundige die jou voorziet van het juiste eten en drinken. Hoewel al deze...

  • Wat betekent het om te wonen, werken, ondernemen en leven in een stad en regio met een internationale universiteit. Wat merk je ervan en wat heb je er eigenlijk aan? We vroegen het aan Maastrichtenaar Stefan Vrancken (50). Stefan werkt als toegevoegd notaris, maar duikt in de tijd die hij daarnaast...

Meer nieuws