Kunstmatige intelligentie blogreeks: Het theorema van Baye

Door: Karin Zwiggelaar
Door: Karin Zwiggelaar

Welkom bij het vijfde artikel in de blogreeks “Kunstmatige intelligentie”. Het vierde deel gaat over “Is fouten maken menselijk”. In dit deel wordt ingegaan op de de informatie uit hoofdstuk 5: Het theorema van Bayes

5. HET THEOREMA VAN BAYES

Het theorema van Bayes is een beroemde regel in de kansberekening. Deze regel wordt bijvoorbeeld gebruikt om kennis over kansen uit vorig onderzoek op een statistisch onderbouwde manier te gebruiken in nieuw onderzoek. Eén bijzondere toepassing van het theorema is het gebruik in zogeheten Bayesiaanse Netwerken. En deze Bayesiaanse Netwerken liggen weer ten grondslag aan meerdere kunstmatige intelligentie algoritmes.

Door: Karin Zwiggelaar
Door: Karin Zwiggelaar

Wat is de kans dat je ziek bent als je positief test?

Beeld je in dat er in het land een ziekte heerst, die bij 1 op de 1000 mensen voorkomt (prevalentie is 1/1000), en je bent bang dat je deze ziekte hebt. Gelukkig is er een goede diagnostische test beschikbaar, die met behulp van een AI-model jouw data interpreteert en aangeeft of je ziek of gezond bent. Als je de ziekte daadwerkelijk hebt, geeft de test in 100% van de gevallen een positief resultaat. Deze test kan, met behulp van AI, artsen helpen een diagnose te stellen. Maar AI is niet onfeilbaar en ook deze test is niet perfect. Voor gezonde mensen, die de ziekte niet hebben, geeft de test namelijk in 5% van de gevallen per abuis alsnog een positieve uitslag. Stel je voor dat je je hebt laten testen en de test slaat positief uit. Help, dat is allesbehalve positief nieuws!

Nu komt echter de grote vraag: wat is de kans dat je ook daadwerkelijk ziek bent? Veel mensen – en misschien jij ook – zeggen “95%, natuurlijk”. Zo ook toen deze vraag werd voorgelegd aan een groep medicijnstudenten van de vooraanstaande universiteit Harvard, waarvan bijna de helft dit antwoord gaf. Het correcte antwoord zal je wellicht verbazen. De kans dat je echt ziek bent, is gelukkig slechts 2%.

We kunnen deze merkwaardige uitkomst uitleggen in formules, maar ook intuïtief. Laten we beginnen met de toegankelijke intuïtieve aanpak. Stel er zijn 1000 mensen die zich laten testen. Hiervan verwachten we dat 1 persoon de ziekte heeft en 999 personen gezond zijn. De persoon die echt ziek is, zal positief testen. Van de gezonde mensen, zal de test in 5% van de gevallen alsnog positief kleuren. In totaal zullen er dus gemiddeld 1 + (999 x 0,05) ≈ 51 positieve tests zijn – of 50,95 om exact te zijn. Echter, slechts 1 hiervan is ook echt correct! Dus, als slechts 1 van de 51 positieve uitslagen correct is, is de kans dat je echt ziek bent minder dan 2% – of nog preciezer: 1 / 50,95 x 100% = 1,96%. We kunnen dit ook laten zien met behulp van de confusion matrix:

Figuur 7: Confusion matrix in abosulte waarden (A) en in percentages (B). De 2% toont dus de kans dat je daadwerkelijk ziek bent, gegeven dat je een positieve testuitslag hebt.

Door: Karin Zwiggelaar
Door: Karin Zwiggelaar

Het theorema van Bayes

Voor de wiskundige uitleg gaan we in de leer bij een 18e-eeuwse dominee en
wiskundige genaamd Thomas Bayes (1701-1761). Hij stelde een beroemde regel in de
kansberekening op die later bekend is komen te staan als het theorema van Bayes.
Om deze wijze regel te begrijpen, ontkomen we niet aan (een bescheiden beetje)
statistiek. Hiervoor is het belangrijk een tweetal notaties te begrijpen. De eerste is
de notatie voor een kans, zoals P(ziek): de kans dat je ziek bent. Daarnaast is er de
notatie voor een voorwaardelijke kans, bijvoorbeeld P(ziek|positieve test): de kans
dat je ziek bent, gegeven dat je positief test. Met deze notaties in ons achterhoofd
kunnen we nu samen de kansberekening achter de merkwaardige 2% uitpluizen. Het
theorema van Bayes kan geschreven worden als:
Wat we willen weten is, dit was de kans dat je ziek bent, gegeven dat je een positieve
testuitslag krijgt. Hiervoor gebruiken we ten eerste, de kans dat je positief test gegeven dat je ziek bent. Dit is de eerdergenoemde betrouwbaarheid van de test,
dus deze is 1 (ook wel 100%). Dit vermenigvuldigen we met de kans dat je ziek bent,
aangegeven met . Dit wordt de zogeheten prior genoemd, die de a-priori-kennis
weergeeft over de kans dat je ziek bent voordat je de test afneemt, welke gelijk is aan
de prevalentie van 0,001 (1 op de 1000).
Verder hebben we nodig: de kans op een positieve uitslag. De test kan op twee
manieren positief uitslaan: ofwel je bent echt ziek en hij slaat positief uit (1 x 0,001),
ofwel je bent gezond en de test geeft een onjuiste positieve uitslag (0,05 x 0,999).
Hierbij gebruiken we het gegeven dat gemiddeld 999 van de 1000 mensen gezond
zijn als er 1 persoon van de 1000 ziek is. Dezelfde denkstap passen we toe op de
kans op een foutief positieve uitslag, die gelijk is aan 100% – 95% = 5%. Nu is het een
invuloefening. De kans dat je ziek bent gegeven dat je positief test is gelijk aan:
Merk op dat het theorema van Bayes eigenlijk exact hetzelfde werkt als de eerdere
intuïtieve verklaring. De oplettende lezer herkent in bovenstaand rekenvoorbeeld
de 1/50,95, alleen is het hier als kans weergegeven en niet als aantal mensen in de
bevolking.
De doorslaggevende factor in de berekening is de lage prevalentie van de ziekte
P(ziekte). Doordat de initiële kans op ziekte zo klein is, is ook na een positieve
uitslag de kans om ziek te zijn nog redelijk bescheiden. Daarmee is de 2% een hele
opluchting.

Wat als je nog een test doet?

Toch ben je nog niet helemaal gerustgesteld. Daarom besluit je nog een tweede test
te doen. Deze geeft ook een positieve uitslag. Langs dezelfde logica kunnen we nu
opnieuw berekenen wat de kans is om echt ziek te zijn. Deze gaat van 2% naar 29%.
Vaker testen geeft dus wel degelijk een grotere zekerheid. Kan je zelf de verklaring
geven? Hint: onze a-priori-overtuiging over de kans om ziek te zijn neemt toe, van
0,1% (1 op 1000) naar bijna 2%.
Deze prior-component P(ziekte) maakt de formule uniek en breed toepasbaar. Met
het theorema van Bayes kunnen we namelijk onze kennis updaten in het licht van
nieuw verkregen informatie. Dit is eigenlijk een erg voor de hand liggende redenering.
Je hebt bepaalde kennis van de wereld (hoeveel procent van de mensen is ziek),
vervolgens krijg je nieuwe informatie binnen (zoals een positieve test) en vervolgens
pas je daar je overtuiging op aan van de kans dat je zelf ziek bent. Ook in de
wetenschap wordt dit gezien als een waardevolle manier van redeneren.
Door: Karin Zwiggelaar
Door: Karin Zwiggelaar

Een tweedeling in de wereld van de statistiek

Echter, deze prior heeft flink wat opschudding teweeggebracht in de wereld van de
statistiek. Je kan statistici onderverdelen in twee scholen: frequentisten en Bayesianen.
Deze twee scholen vliegen elkaar geregeld in de haren in een al decennia oud
debat. Waarom? Beide groepen hebben een fundamenteel andere opvatting over wat
een ‘kans’ precies inhoudt. Ja, zelfs binnen de wiskunde is er geregeld onenigheid.
Frequentisten beschouwen een kans als de frequentie waarmee iets gebeurt wanneer
je een experiment vaak herhaalt. Bayesianen beschouwen een kans daarentegen als
de onzekerheid van een bepaalde gebeurtenis. Neem bijvoorbeeld een munt waarvan
je wilt bepalen of die inderdaad eerlijk in 50% van de gevallen kop en 50% van de
gevallen munt gooit. Frequentisten zouden het liefst heel vaak de munt opgooien en
de frequentie van kop en munt berekenen; zij maken hierbij dus nadrukkelijk geen
gebruik van enige bestaande kennis. Bayesianen daarentegen beginnen met een a
priori overtuiging, bijvoorbeeld dat de munt eerlijk is en beide uitkomsten even vaak
gooit, en passen vervolgens na elke keer gooien hun overtuiging een beetje aan.
Een belangrijk punt van kritiek aan het adres van de Bayesianen is hun gebruik van
a-priorische kennis. Frequentisten beschouwen dit als subjectief en daarom niet
wetenschappelijk verantwoord. Bayesianen menen dat het juist wel wenselijk is. Op
deze manier kan opgedane kennis uit vorig onderzoek namelijk op een statistisch
onderbouwde wijze worden gebruikt in nieuw onderzoek.
Welke statistische school je ook naleeft, het theorema van Bayes heeft zich bewezen
op veel vlakken. Bovenstaand voorbeeld laat zien dat zonder het theorema van Bayes
er een grote kans is op onjuiste medische diagnoses, waarbij artsen te snel kunnen
concluderen dat je ziek bent, met een nodeloze behandeling als gevolg. Het gebruik
van prior kennis en eventuele meerdere testen helpt om een nauwkeuriger oordeel te
vellen.
Door: Karin Zwiggelaar
Door: Karin Zwiggelaar

Bayesiaanse netwerken

Ook in de kunstmatige intelligentie wordt het theorema van Bayes en Bayesiaanse
statistiek gebruikt, bijvoorbeeld om modellen te optimaliseren of om expertkennis
statistisch verantwoord te gebruiken in een model. Eén bijzondere toepassing is
het gebruik van zogeheten Bayesiaanse Netwerken. Hierin wordt het theorema van
Bayes gebruikt om de verbanden en afhankelijkheden tussen meerdere variabelen
te modelleren. Een groot voordeel hiervan is dat we complexe verbanden wiskundig
kunnen modeleren, maar dit model tegelijkertijd op een heel begrijpelijke manier
kunnen visualiseren.
Een dergelijke visualisatie helpt niet alleen in de interpretatie van de modeluitkomsten
maar ook in het uitleggen hoe het model tot bepaalde voorspellingen komt.
Bij veel AI-modellen is dit een heikel punt. Een belangrijk toepassingsgebied van deze
netwerken is de medische wetenschap, waar ze onder andere gebruikt worden voor
astmaonderzoek. Door menselijk DNA en genen te modelleren in een Bayesiaans
Netwerk kan bestudeerd worden welke genetische factoren de meeste invloed hebben
op het ziektebeeld en hoe deze factoren elkaar onderling beïnvloeden, zoals ook
besproken wordt in hoofdstuk 33 over AI in DNA-onderzoek.
Of het nou gaat om complexe AI-modellen, of een medische diagnostische test:
het theorema van Bayes speelt een belangrijke rol. Mocht je in de toekomst zelf een
dergelijke test afnemen, onthoud dan deze wijze les van dominee Bayes: “De kans op
ziekte, gegeven een positieve test, is zowel afhankelijk van de nauwkeurigheid van de
test als van de prevalentie van de ziekte”. En als je meerdere tests afneemt, dan hopen
we van harte dat je derde test niet meer positief is, want dan schiet de kans op ziekte
alweer naar 89%

Geïnteresseerd in het boek?
Bestel het hier