Dit is het derde deel uit de serie artikelen over randomised response en de wet van Bayes.
Deel 1 vind je hier.
Deel 2 vind je hier.
Wanneer een ondervraagde nee als antwoord geeft, weten we niet of dit het antwoord op vraag 1 of 2 is. Maar wat we wel kunnen berekenen, is de kans dat iemand zijn handen niet wast wanneer het antwoord ja is. Met andere woorden: als iemand ja antwoordt, wat is dan waarschijnlijker: dat hij wel of geen handenwasser is? Of maakt het geen verschil? En hoe zit dat als het antwoord nee is?
We zijn in eerste instantie dus geïnteresseerd in het deel van de ondervraagden dat zijn handen niet wast, maar we willen dat alleen weten van het deel dat ja antwoordt. Je noteert dat als P(wasser|ja). De verticale streep moet je lezen als “onder de voorwaarde dat”. Het betekent: de kans dat iemand geen wasser is, onder de voorwaarde dat diegene ja zei. Oftewel: welk deel van de ja-zeggers wast zijn handen niet?
Wat we al weten, is het omgekeerde: P(ja|wasser). Dit is dus de kans dat iemand die zijn handen niet wast, ja zegt. Als een niet-handenwasser ja heeft gezegd, dan wil dat zeggen dat hij vraag 2 beantwoord heeft ("Was je niet na elk toiletbezoek je handen?"). De kans op het beantwoorden van vraag 2 is 0,75. Vandaar dat P(ja|wasser) = 0,75.
Hoe kunnen we nu P(wasser|ja) berekenen als P(ja|wasser) bekend is? Daarvoor bestaat een bekende formule uit de kansrekening, namelijk de Wet van Bayes:
Vertaald naar ons handenwasvoorbeeld staat er dus:
P(wasser|ja) = P(ja|wasser) * P(wasser) / P(ja)
P(wasser) is de kans dat iemand zjin handen niet wast. Het onderzoek in deel 2 heeft uitgewezen dat dit 0,6 is.
P(ja) is de kans dat iemand ja antwoordt. Met 275 van de 500 mensen is dat dus 0,55.
Nu hoeven we nog maar in te vullen:
P(wasser|ja) = 0,75 * 0,6 / (275/500) = 0,818...
Op dezelfde manier kun je berekenen wat de kans is dat iemand zijn handen niet wast wanneer wanneer het antwoord nee is.
P(wasser|nee) = 0,25 * 0,6 / (225/500) = 0,333...
Je ziet dus, dat wanneer iemand ja heeft zegt het veel waarschijnlijker was dat hij handen niet wast, dan wanneer het antwoord nee zou zijn geweest! Die kans is bijna 3 keer zo groot!
Je moet wel beseffen dat je niet al vooraf en bij elke enquête kunt concluderen dat de kans dat iemand zijn handen niet wast bijna 3 keer zo groot is wanneer die persoon ja zegt. In de berekening ervan hebben we namelijk de uitslag van de enquête meegenomen. Als de uitslag anders zou zijn geweest, dan zouden P(wssser|ja) en P(wasser|nee) ook andere waarden hebben gehad.
De wet van Bayes is een bekende, maar beruchte wet binnen de kansrekening. Vaak wordt de formule verkeerd geïnterpreteerd. Misschien heb je wel eens van de geruchtmakende rechtszaak over Lucia de B. gehoord, over de verpleegster die werd beschuldigd van de dood van enkele van haar patiënten. In deze rechtszaak werd de wet van Bayes gebruikt bij de bewijsvoering. Een uitgebreid artikel hierover vind je hier.
Ik heb deze artikelen gebaseerd op deze YouTube video van @JamesGrime.