Limburgs op de digitale kaart
Het Limburgs kampt al jaren met een groot tekort aan digitale middelen en technische systemen om de taal en al haar dialecten te ondersteunen, bestuderen en toegankelijk te maken. Dit gebrek belemmert niet alleen wetenschappelijk onderzoek, maar ook de ontwikkeling van digitale toepassingen zoals spraakherkenning, machinevertaling en andere AI-gebaseerde technologieën.
Een nieuw project, uitgevoerd door Andreas Simons onder leiding van Leonie Cornips (leerstoel Taalcultuur in Limburg) en gesubsidieerd door het Hoes veur ’t Limburgs, zet zich nu in om daar verandering in te brengen.
Waarom een Limburgs Corpus?
Moderne technologieën en wetenschappelijk onderzoek op taalgebied zijn afhankelijk van zogenaamde ‘corpora’: grote databases met bronmateriaal zoals boeken, poëzie, internetblogs en gesprekken. Het Limburgs behoort echter tot de slechtst gedocumenteerde Germaanse talen. Dit zorgt ervoor dat de taal nauwelijks toegankelijk is voor onderzoekers, ontwikkelaars, onderwijs en overheden. Het gebrek aan digitale beschikbaarheid leidt tot een vicieuze cirkel waarin de zichtbaarheid, het gebruik en het prestige van het Limburgs verder afnemen.
Ondanks deze uitdagingen is er een groeiende belangstelling voor het Limburgs. Jongeren gebruiken de taal steeds vaker op sociale media, en er bestaan diverse bronnen zoals lokale literatuur, dialectwoordenboeken en theaterscripts. Wat ontbreekt, is een centrale en openbaar toegankelijke opslagplaats voor dit materiaal.
Digitale Infrastructuur in het Hoes veur ’t Limburgs
In een jaar tijd wordt een digitale infrastructuur (digitale middelen en technische systemen om de taal op te slaan, te beheren en toegankelijk te maken) opgezet om een Limburgs Corpus te verzamelen, beheren en aan te vullen. Aan het einde van het project zal een basisversie van het corpus beschikbaar zijn voor verder wetenschappelijk onderzoek en toepassingen in de industrie. Een bewerkte versie van het corpus wordt openbaar beschikbaar gesteld, zodat onderzoekers, studenten en ontwikkelaars met de data aan de slag kunnen. Dit zal een sneeuwbaleffect creëren voor verder onderzoek en het Limburgs positioneren als een ‘bestudeerbare’ taal.
De infrastructuur zal bovendien eenvoudig uitbreidbaar zijn, zodat toekomstige projecten het corpus kunnen aanvullen en verder ontwikkelen. Dit maakt de weg vrij voor het trainen van taalmodellen en andere toepassingen, vergelijkbaar met initiatieven voor andere minderheidstalen.
Foto gemaakt door: Laura Knipsael
Lees ook
-
YUFE Academy Autumn 2025
Join the next YUFE Academy: a series of open lectures led by top professors and experts from our partner universities. Get your knowledge from a reliable source and feed your curiosity.
-
Dr. Anjusha Mathew gebruikt massaspectrometrie en cryo-EM om inzicht in complexe eiwitstructuren te veranderen
De Indiase Anjusha Mathew kwam in 2018 als PhD-kandidaat naar Maastricht. Nu – 7 jaar later – is ze onderzoeker en universitair docent bij onderzoeksinstituut M4i, een onderdeel van de Faculty of Health, Medicine and Life Sciences. Onlangs ontving Mathew een groot subsidiebedrag voor haar onderzoek...
-
Dongning Ren ontvangt ERC-subsidie voor haar onderzoeksvoorstel over ostracisme.
FPN-collega dr. Dongning Ren heeft een zeer competitieve ERC-subsidie ontvangen voor haar project: Using a principled causal approach for causal queries: the Ostracism Causal Project.