Nooit meer een Toeslagenaffaire: Anna Wilbik werkt aan eerlijke en veilige computermodellen.

Interview Anna Wilbik

Bedrijven en organisaties verzamelen meer en meer data als ondersteuning van hun dagelijkse functioneren. Maar, persen ze die data wel tot de laatste druppel uit? Volgens Anna Wilbik valt er meer uit data te halen. Op 19 april legde ze tijdens haar oratie uit welke technieken ze hiervoor onderzoekt. Wilbik is hoogleraar Data Fusion en Intelligent Interaction aan de Universiteit Maastricht.

Patrick Marx

Anna Wilbik werkt aan betere computermodellen die data uit meerdere bronnen combineren. Ze onderzoekt veiligere manieren voor het implementeren van de modellen. Hiervoor gebruikt ze technieken als Data Fusion, Federated Learning en Intelligent Interaction. Wat? De uitleg volgt zo meteen, eerst is het tijd om Anna voor te stellen. 

Anna Wilbik groeide op in Polen in een ingenieursfamilie. Haar ouders zijn beiden civiel ingenieur, haar broer is architect. “Ik wilde ook ingenieur worden, maar toen mijn moeder hoorde dat ik civiele techniek koos, geep ze in. Ze vertelde me dat het respect voor vrouwen binnen dit vakgebied ver te zoeken is. Omdat ik van wiskunde houd, koos ik informatica als alternatief. Ik studeerde aan de technische universiteit in Warschau zodat ik toch ingenieur zou worden.”

foto

Natural language

Na haar afstuderen en promotie in Polen werkte Anna als postdoc in de VS. “Mijn werk verschoof van puur academisch naar meer toegepast. Tijdens mijn promotieonderzoek ontwikkelde ik methoden voor het omzetten van numerieke data in gewone, natuurlijke taal (natural language). In de VS pasten we natural language toe door bij ouderen verzamelde data om te zetten naar adviezen in natuurlijke taal voor de verpleegkundigen die de ouderen verzorgen.”

Wetenschappers hebben meestal geen moeite met data in de vorm van cijfers. De meerderheid van de algemene bevolking heeft dat echter wel. “De meeste mensen begrijpen natuurlijke taal makkelijker dan getallen. We weten wat het cijfer op de snelheidsmeter in onze auto aangeeft, maar als het dashboard een wereld aan numerieke data laat zien, dan raken we de weg kwijt. Als je dan bedenkt dat, bijvoorbeeld, de hoeveelheid data die een ziekenhuis produceert elke twee jaar verdubbelt, dan zie je dat het in begrijpelijke taal samenvatten van data steeds belangrijker wordt.”

Data Fusion

Sinds 2020 werkt Anna bij het Department of Advanced Computing Sciences aan de Faculty of Science and Engineering. In Maastricht richt ze zich op het combineren van diverse databronnen voor betere modellen en het veilig implementeren van de modellen. Eerst de data: In het algemeen verzamelen bedrijven en instellingen data in aparte databases. Het gaat om heterogene informatie over bijvoorbeeld de productie, onderhoud, verkoop enz. Stel je voor dat je al deze data fuseert, dan kan een bedrijf een model maken dat op tijd aangeeft wanneer onderhoud nodig is, waarna de planner dit op een zo goed mogelijk moment in kan inplannen waardoor een kleinere voorraad reserveonderdelen nodig is. Het vakgebied dat zich hier mee bezighoudt noemen we Data Fusion.”

big data croped

Federated leaning

Bij medisch wetenschappelijk onderzoek verwerken onderzoekers de medische gegevens van patiënten. Meestal gaat het om onderzoek in meerdere ziekenhuizen tegelijk. Vanwege privacywetgeving wordt dit een steeds moeilijkere opgave. Federated Learning brengt uitkomst. “Elk ziekenhuis traint een deel van het computermodel met zijn eigen data. De wetenschappers verzamelen dan de deel-modellen en voegen die samen tot een compleet model. Op deze manier hoeft de data van de patiënt het ziekenhuis nooit te verlaten. Federated Learning is ook terug te vinden in je smartphone. Wanneer je een woord typt geeft de telefoon suggesties van woorden die je waarschijnlijk bedoelt. Dit kan dankzij Federated Learning waarbij je data je telefoon nooit verlaten.

Intelligent interaction

Dankzij alle fusie-technieken heb je dan eindelijk een nieuw computermodel, maar wat doe je dan met de informatie die het model presenteert? Het vakgebied Intelligent Interaction bekijkt hoe kunstmatige intelligentie kan anticiperen op de manier waarop ze informatie presenteert aan bijvoorbeeld mensen of andere informatiesystemen.

“De Toeslagen- en DUO-affaire illustreren het belang van een juiste en betrouwbare presentatie van de gegevens. Een vooringenomen computermodel wees duizenden mensen ten onrecht als fraudeurs aan. Geautomatiseerde besluitvorming heeft een effect op een heel spectrum aan mensen, bedrijfsprocessen en informatiesystemen. De besluiten kunnen zelfs doorwerken op de daaropvolgende besluiten.” Naast haar werk bij het Department of Advanced Computing Sciences werkt Anna bij het Heerlens Brightlands Institute for Smart Society. Hier richt ze zich, met Intelligent Interaction, op het veilig laten werken van modellen op een eerlijke en niet vooringenomen manier. “Hierdoor kunnen mensen beter begrijpen hoe geautomatiseerde besluiten tot stand komen en problemen met het model makkelijker opsporen en verbeteren.”

Soms wil Anna de eindeloze stroom data in haar hoofd uitzetten. Dan trekt ze haar duikuitrusting aan en gaat duiken. “Op het moment dat ik onderwater ben, houdt de wereld erboven op te bestaan. Mijn hele aandacht gaat dan uit naar het hier en nu.” Duiken geeft Anna de kans af te schakelen zodat ze daarna haar onderzoek naar veilige en veilig geïmplementeerde computermodellen weer op kan pakken.” 

Geautomatiseerde besluitvorming heeft een effect op een heel spectrum aan mensen, bedrijfsprocessen en informatiesystemen. De besluiten kunnen zelfs doorwerken op de daaropvolgende besluiten.

Lees ook