Laat me je Twitterfeed zien en ik vertel je wat je probleem is
Datawetenschapper Marijn ten Thij bestudeert menselijk gedrag aan de hand van berichten die worden gepost op sociale media. Zo bracht hij bijvoorbeeld de veranderende stemming tijdens de coronapandemie in kaart met behulp van 3.5 miljoen tweets. De analyse van dit soort data is niet alleen maatschappelijk relevant, het kan ook individuele personen helpen die in psychische nood verkeren. De onderliggende patronen zijn ronduit intrigerend, zegt Ten Thij.
“Mijn terrein is data-analyse, mijn achtergrond is toegepaste wiskunde en in de afgelopen jaren ben ik steeds meer richting informatica gegaan.” Zo vat Marijn ten Thij, universitair docent verbonden aan het Department of Advanced Computing Sciences, zijn werkzame leven samen. De focus daarvan ligt op het bestuderen van menselijk gedrag door het analyseren van de sporen die velen van ons in het dagelijks level achterlaten op online platformen en netwerken. “Mijn onderzoek laat zien dat je heel veel van mens en maatschappij kan leren op basis van de informatie die we vrijwillig prijsgeven, zonder dat daarbij de privacy van individuele gebruikers in het geding komt.”
Project X
Min of meer bij toeval ontdekte hij Twitter als geschikte databron bij uitstek. Als onderdeel van zijn studie aan de Universiteit Twente legde hij zich toe op het modelleren van de informatieverspreiding in een online netwerk. Het was in de tijd dat een dorp in Groningen ineens wereldnieuws werd. In 2012 kwamen duizenden mensen af op het verjaardagspartijtje van een meisje in Haren, dat haar vrienden via Facebook had uitgenodigd. Het dorp was niet berekend op een dergelijke toestroom, de stemming sloeg snel om en ‘Project X Haren’ liep uit op rellen en vernielingen.
“Destijds heb ik gekeken naar de vraag of we hadden kunnen voorspellen dat dit zo groot zou worden. Zouden we daar wiskunde voor kunnen gebruiken? Later ben ik gaan zoeken naar een manier waarop we de juiste personen op Twitter kunnen vinden om een specifieke analyse te starten of een specifiek effect te meten. En hoe we dat het beste kunnen doen zonder dat de resultaten terug te brengen zijn naar individuele accounts die gebruikt zijn in de analyse. Dat is in het kort waar mijn werk uit bestaat.”
Meten van sentiment
Dit heeft geleid tot een groot aantal studies over verschillende maatschappelijke onderwerpen. Dit jaar verscheen vrijwel elke maand een onderzoekspaper van zijn hand in internationale publicaties. Zo beschreef hij met behulp van wiskundige modellen de psychosociale factoren die ten grondslag liggen aan rigide standpunten aan weerszijden van het abortusdebat en mat hij de sociaal-emotionele impact van natuurrampen zoals orkanen.
Eerder liet hij op basis van miljoenen tweets zien hoe de COVID-pandemie tot een verandering leidde in de manier waarop mensen over de toekomst dachten. Een van de resultaten was dat tweets die over de middellange toekomst gingen, meer somberheid lieten zien dan tweets die verwezen naar de nabije of verre toekomst. Het sentiment was het laagst voor de periode tussen vier weken en 12 maanden vanaf het tweet-moment. Opvallend daarbij was dat er onderliggende patronen aan het licht kwamen die ook bij geheel andere thema’s werden aangetroffen.
Terugkerende golfbeweging
Tijdens de eerste grote COVID-golf bestudeerde Ten Thij als lid van een internationale onderzoeksgroep het gemiddelde dagelijks sentiment in 20 grote steden in de VS. Ze gebruikten daarvoor machine learning en open-source algoritmes zoals VADER. Het was een woelige periode waarin verschillende ingrijpende gebeurtenissen plaatsvonden.
“Maar of het nu gaat over de dood van basketballer Kobe Bryant, het moment waarop COVID-19 officieel tot pandemie wordt verklaard, of de moord op George Floyd, telkens zie je een soort golfbeweging in het maatschappelijk sentiment. Eerst een duidelijke exponentiële afname in het sentiment waarna het weer rustig terugkomt op het oude niveau. In een andere studie ontdekten we eigenlijk dezelfde patronen bij orkanen. Zo zie je dat nieuwscycli verweven raken in een platform als Twitter en hoe dat onze aandacht pakt en weer loslaat. Intrigerend, want het lijkt alsof het onderliggend voor ons gedrag niet heel veel uitmaakt wat het onderwerp precies is, en dat er hele simpele formules achter zitten.”
Marijn ten Thij is universitair docent Data Fusion bij het Department of Advanced Computing Sciences aan de Universiteit Maastricht. Na zijn studie toegepaste wiskunde aan de Universiteit Twente heeft hij onderzoek gedaan aan een aantal universiteiten waaronder de Vrije Universiteit Amsterdam, Technische Universiteit Delft en Indiana University.
Ten Thij's onderzoek probeert het menselijk gedrag te verklaren door de sporen te analyseren die we achterlaten in online platforms en netwerken. In de afgelopen jaren heeft hij, vaak samen met wetenschappers uit andere disciplines, diverse studies gepublieerd over cognitieve onderwerpen en geestelijke gezondheidskwesties.
Meerwaarde bij psychotherapie
Dezelfde mathematische modellen kunnen ook worden toegepast op individuele gevallen. Onlangs is Ten Thij begonnen met een onderzoekslijn waarin wordt nagegaan hoe data uit sociale media kan worden ingezet in de therapiepraktijk wanneer de patiënt hier zelf expliciete toestemming voor geeft, bijvoorbeeld bij de behandeling van depressie.
“Het kan meerwaarde leveren. Met onze algoritmes gaan we de psychiatrie natuurlijk niet volledig automatiseren, want zodra je gaat werken met mensen, moet je altijd individuele details meewegen. Kortom: het blijft mensenwerk. Maar als je uitgaat van de theorie van cognitieve gedragstherapie, een van de meest gebruikte methodes om depressie te behandelen, dan kun je individuele tijdlijnen napluizen op gedachtenpatronen die met depressie te maken hebben. We kunnen dan handreikingen doen om dat soort gedachtenpatronen te doorgronden en te onderbreken, zodat iemand ze niet meer maakt.”
Dit kan helpen om sessies met de psycholoog effectiever in te zetten. “De tijd met de psycholoog kan dan anders worden gebruikt. Want je verstoorde gedachtenpatronen zijn al gedetecteerd en op je sociale mediaberichten krijg je feedback wanneer je weer op zo’n gedachtentrein zit.”
Ten Thij benadrukt dat er legio andere modaliteiten zijn waarop je zijn wiskundige modellen zou kunnen loslaten. Je persoonlijke Whatsapp-geschiedenis bijvoorbeeld. “Dat is ook wat we in dit specifieke onderzoek willen vaststellen: Wat is de beste databron om psychologen zo goed mogelijk te kunnen helpen?”
Zelfanalyse
Mocht dit realiteit worden, dan lijkt Ten Thij’s eigen tijdlijn niet in aanmerking te komen voor dit soort analyses. “Nee, ik ben niet het type dat uitbundig post en zijn innerlijke beleving blootgeeft. Dat blijkt bijvoorbeeld wel uit het feit dat mijn vrouw en ik pas na vijf jaar in onze relatie ‘Facebook official’ werden. Ik heb wel op vele sociale media een account, maar vooral uit professionele motieven: om ze in de gaten te kunnen houden voor mogelijk gebruik als databron.”
Dat betekent dus ook dat hij zijn modellen niet kan loslaten op zijn eigen Twitterfeed en dat hij op die manier ook niet wat meer over zichzelf te weten kan komen. “Ja, dat is zo, want ik voorzie mezelf inderdaad niet van voldoende data.”
Facebook mag dan tien keer zoveel gebruikers hebben, Twitter is voor onderzoekers als Ten Thij een meer geschikte databron. Dat komt vooral door de hoge toegankelijkheid van het platform.
Daarnaast blijkt uit onderzoek van Johannes Eichstaedt, onderzoeker aan Stanford, dat er een hoge correlatie is tussen het sentiment op Twitter en het sentiment dat naar voren komt in nationale vragenlijsten en opiniepeilingen (surveys) in de VS.
Ten Thij: “Als onderzoeker probeer je altijd vast te stellen of het platform dat je gebruikt ook representatief is. Dat moet je blijven controleren omdat platforms evolueren en mensen het anders gaan gebruiken.”