16 juni 2020

LHCb-experiment van CERN omarmt grafische kaarten om grote hoeveelheden data te filteren

Dr. Daniel Cámpora wint Early Career Scientist Award

 

De resultaten zijn binnen: de eerste datafilter van de LHCb-detector zal in de toekomst bestaan uit honderden grafische kaarten. De datafilter selecteert welke deeltjesbotsingen worden opgeslagen en bestudeerd bij het LHCb-experiment van de Large Hadron Collider. Eén van de drijvende krachten achter de innovatie is Dr. Daniel Cámpora (Department of Data Science and Knowledge Engineering, Nikhef).

Momenteel staat de Large Hadron Collider langere tijd uit. Tijdens deze tweede rustperiode wordt de deeltjesversneller opgewaardeerd, waarna de experimenten in mei 2021 weer van start gaan. Eén van deze experimenten is het LHCb-experiment, met de b voor beauty quark: een deeltje dat ons hopelijk leert begrijpen waarom het universum momenteel uit materie bestaat, en niet uit antimaterie.

Groot, groter, grootst

De vragen die in Genève worden beantwoord zijn wellicht net zo verbijsterend als de Large Hadron Collider zelf. Meer dan 10.000 wetenschappers en ingenieurs zijn betrokken bij de ondergrondse deeltjesversneller, die een omtrek van 27 kilometer heeft en meer data produceert dan opgeslagen of geanalyseerd kan worden. Wanneer de deeltjesversneller weer draait, produceert alleen het LHCb-experiment straks al meer dan 5 terabyte aan data per seconde – het equivalent van zo’n 1,4 miljoen MP3-liedjes. 

LHCb experiment

De LHCb-detector in 2008.
©CERN/Maximilien Brice

Deze enorme datastroom wordt in banen geleid door twee zogenaamde triggersystemen (‘trigger’ voor trekker, of startimpuls) die relevante deeltjesbotsingen live selecteren. De data die bij die botsingen hoort wordt gefilterd, opgeslagen en geanalyseerd, waardoor de datastroom wordt teruggebracht naar een meer beheersbare 10 gigabyte – of 3,000 MP3-liedjes – per seconde. Volgens planning worden ook deze triggersystemen opgewaardeerd.

Koerswijziging

“De voorbereidingen voor de upgrade van 2021 begonnen ongeveer tien jaar geleden”, zegt Dr. Daniel Cámpora. Zijn werk als promovendus legde de basis voor een koerswijziging. “Het plan was lange tijd om betere versies van de huidige hardware te installeren. Snellere processors, bijvoorbeeld.” Processors, ook wel bekend als CPUs of central processing units, voeren doorgaans het leeuwendeel van de berekeningen uit. Dat geldt voor zowel huis-tuin-en-keukencomputers als voor wetenschappelijke experimenten, waaronder nu nog HLT1, het eerste triggersysteem van de LHCb-detector.

Dr. Cámpora keek echter al langere tijd naar de opmars van GPUs: graphical processing units, beter bekend als grafische kaarten. “Dat is het soort hardware waar ze Pixarfilms mee maken”, lacht hij. “Ook computerspellen leunen zwaar op GPUs die het meeste werk doen. Maar sinds de laatste tien jaar zijn GPUs volledig programmeerbaar geworden. Je kan er elk probleem mee oplossen dat je wil.”
 

Op elk potje past een (parallel) dekseltje

Toch zijn sommige problemen geschikter voor grafische kaarten dan andere. Eén van de verschillen tussen CPUs en GPUs is hoe ze veel verschillende berekeningen maken: CPUs doen dat één voor één, terwijl GPUs – grafische kaarten – meerdere berekeningen tegelijkertijd maken. Dat laatste maakt ze uitermate geschikt voor het hanteren van enorme hoeveelheden deeltjesbotsingen.

“Ik speel al sinds 2010 met deze hardware”, herinnert Dr. Cámpora zich, “en vanaf het moment dat ik me bij CERN aansloot, dacht ik na over het verwerken van GPUs in experimenten van de Large Hadron Collider. Maar iets compleet nieuws introduceren is niet makkelijk. Je moet software ontwikkelen om het efficient te laten werken. Er staat ook veel op het spel: er zijn veel mensen bij het experiment betrokken, en niemand wil dat het fout gaat.”

Dr. Daniel Cámpora
Postdoctorale onderzoeker bij het Department of Data Science and Knowledge Engineering (UM) en Nikhef

Klaar voor de start, af?

Om het nieuwe triggersysteem tot realiteit te maken, sloeg Dr. Cámpora de handen ineen met Dr. Roel Aaij (Nikhef) en Dr. Dorothea vom Bruch (French Laboratory of Nuclear and High-Energy Physics). In die tijd was hij promovendus bij CERN en bij de Spaanse University of Seville. “In eerste instantie waren weinig mensen geïnteresseerd in deze technologie. Na 15 maanden was het project echter zo successvol, dat we een groep externe experts uitnodigden om een oordeel te vellen over wat we tot nu toe hadden bereikt. Zij concludeerden dat GPUs een rendabele oplossing waren.”

De externe experts hadden het bij het rechte eind. Vorige maand viel het definitieve besluit: wanneer de Large Hadron Collider straks opnieuw opstart, draait het eerste triggersysteem van de LHCb-detector op grafische kaarten. Precies zoals Dr. Cámpora en zijn collega’s voorstelden. “Het is ontzettend bevredigend”, straalt hij. “Dit project maakt echt deel uit van mij.”
 

Early Career Scientist Award

Toen Dr. Cámpora ons dit vertelde, wist hij niet dat het verhaal nog een tikje bevredigender zou worden. Op 11 juni reikte de LHCb-samenwerking de 2020 Early Career Scientist Award uit aan Dr. Daniel Cámpora en Dr. Dorothea vom Bruch, voor deze bijdrage aan het LHCb-experiment.
 

Lees verder
Allen initiative – supported by CERN openlab – key to LHCb trigger upgrade (cern.home, Engelstalig)
Publicatie: Allen: A High-Level Trigger on GPUs for LHCb (Engelstalig)

Allen: alle(maal verbeteringe)n

Het nieuwe, op GPU’s gebaseerde triggersysteem is Allen genoemd, naar de beroemde computerwetenschapper Frances E. Allen. Allen heeft grote voordelen ten opzichte van zijn voorloper.

“Dankzij Allen gaat er straks zo’n 30 keer minder data verder het systeem in”, legt Dr. Daniel Cámpora uit. “Dat betekent dat je een veel goedkoper netwerk kan gebruiken. Onderhoud is ook makkelijker, omdat het een compact systeem is. En misschien het meest interessant: Allen wordt sneller en sneller. We hebben meer rekenkracht, wat uiteindelijk betekent dat we betere natuurkunde kunnen doen.”