Algoritme kan leren zonder voorbeelden

Allard Hendriksen (CWI) ontwikkelde een algoritme dat röntgenbeelden verbetert, zónder dat het hoeft te leren van data uit eerdere metingen. Hij promoveert op 3 maart aan de Universiteit Leiden.

Publicatiedatum
2 maart 2022

In donutvormige gebouwen maken deeltjesversnellers supergedetailleerde röntgenfoto's. Toch zijn die beelden niet goed genoeg om bijvoorbeeld te leren hoe we kunnen rijden op waterstof. Promovenus Allard Hendriksen (CWI) ontwikkelde een algoritme dat de beelden verbetert, zónder dat het hoeft te leren van data uit eerdere metingen. Die zijn er namelijk niet. Hij promoveert op 3 maart aan de Universiteit Leiden.

Allard Hendriksen
Allard Hendriksen

Het indrukwekkendst vond Allard Hendriksen de synchrotrons die hij bezocht in Zwitserland en Frankrijk. 'Ik kende de CT-scans met röntgenstraling uit het ziekenhuis, maar dit zijn enorme donuts in het landschap, die bij Grenoble heeft een diameter van wel achthonderd meter. Er draaien elektronen in rond op ongeveer de lichtsnelheid. Waar ze uit een van de veertig bochten vliegen, schieten ze röntgenstraling de ring uit.'

Van rijden op waterstof...

Terwijl je voor een CT-scan in het ziekenhuis soms minuten moet stilliggen, maakt een synchrotron zo tien volledige 3D-reconstructies per seconde. Hij is een miljard keer sterker dan de ziekenhuisscan. Dat is niet genoeg om bijvoorbeeld een werkende brandstofcel goed te volgen. 'Toyota wil rijden op waterstof mogelijk maken. Daarvoor moet je kunnen zien wat er precies gebeurt in zo'n brandstofcel terwijl hij werkt. We willen wel drieduizend foto's per seconde.'

...Tot elke cel van een muizenbrein in beeld

Soms is de huidige kracht wel genoeg, maar kan het te onderzoeken object de straling niet aan. 'Een stukje hersenweefsel zwelt op tot een soort pudding bij zo veel straling. Zo werken onderzoekers aan een compleet beeld van een muizenbrein, met alle miljarden zenuwcellen en alle verbindingen daartussen. Daar doen ze jaren over, want nu kan het alleen door microscopisch dunne plakjes stuk voor stuk onder de microscoop te leggen. Een gigantisch project waarbij heel veel data ontstaan.'

Algoritmen leren gewoonlijk van bestaande datasets 

Hendriksen is gek op zulke grote datasets en heeft naar eigen zeggen veel zitvlees. Hij ontwikkelde een zelflerend of deep learning algoritme dat met minder straling of met meer snelheid beelden op het benodigde detail kan laten zien. Normaliter leren algoritmen van bestaande datasets. Voer ze heel veel hersenscans en ze snappen hoe hersenen eruitzien op het niveau dat nodig is om bijvoorbeeld een tumor te onderscheiden. Van brandstofcellen op waterstof en hersenen op celniveau zijn die data er nu juist niet.

Dit algoritme leert van hoe het níét moet

De oplossing die Hendriksen uitwerkte klinkt een beetje raar. 'Ik liet het algoritme juist leren van hoe het níét moet. Ik splits de dataset in tweeën. Met de ene halve set moet het algoritme de andere set proberen te bedenken. Van de ene set naar de andere en andersom; wij kunnen steeds controleren hoe goed het klopt.'

Het werkt echt, en wiskundig klopt het

Zodra het algoritme de gaten goed genoeg invult, kun je erop vertrouwen dat het op basis van de volledige dataset uit de scanner een dubbel zo scherp of nog scherper beeld correct construeert. Door wiskundig na te denken over wat zijn algoritme moest doen, kon Hendriksen ook theoretisch beredeneren dat het kan. Zijn resultaten worden nu toegepast bij het onderzoek naar hersenen op celniveau.

Doorbraak: geen 300 maar 299,924 foto's per seconde

Allerlei data-onderzoekers gaven Hendriksen datasets waarmee ze al van alles hadden geprobeerd. 'Het mooiste moment was toen ik werkte aan een dataset van een brandstofcel. Het wilde maar niet lukken. Tot ik me in de data ging verdiepen. Mij was verteld dat de rotatiesnelheid driehonderd foto's per seconde was. Dat bleken er 299,924 te zijn. Dat was de doorbraak, nu begreep ik dat de verschillende plakjes van het 3D-beeld net niet op elkaar pasten en steeds iets draaiden. Na correctie verscheen het beeld opeens.'

Allard Hendriksen deed zijn promotieonderzoek in de Computational Imaging onderzoeksgroep van het CWI (Centrum Wiskunde & Informatica) en het LIACS (Leiden Institute of Advanced Computer Science). De verdediging van het proefschrift vindt plaats op 3 maart 2022. De promotor is Joost Batenburg. Kijk op de online webagenda van de Universiteit Leiden voor praktische informatie over de promotie.

Tekst promotie Allard Hendriksen: Rianne Lindhout
Foto: ESRF, Grenoble