Dit is deel 2 van 3 uit de serie artikelen over randomised response en de wet van Bayes. Deel 1 vind je hier.
Het volgende is je waarschijnlijk al opgevallen. Als iemand het antwoord nee geeft weet je welke vraag hij beantwoord heeft, namelijk de gênante vraag. Hoewel het natuurlijk niet zo erg is om nee te antwoorden, is de enquête hierdoor toch niet helemaal anoniem, wat toch wel bezwaren zou kunnen opleveren. Daarom kijken we nu naar een andere aanpak.
In plaats van een standaard antwoord en een gênante vraag, stellen we nu twee tegenovergestelde vragen, zodat het antwoord ja op de ene vraag hetzelfde zou zijn als het antwoorden van nee op de andere vraag (en omgekeerd). We doen het nu dus als volgt:
Vraag 1: Was je na elk toiletbezoek je handen?
Vraag 2: Was je niet na elk toiletbezoek je handen?
In plaats van gebruik te maken van slechts een muntje, laat je de deelnemers nu twee muntjes opgooien. Wat het resultaat is, moet iedereen weer voor zichzelf houden. Wanneer het resultaat twee keer kop is, moet vraag 1 (eerlijk!) worden beantwoord met ja of nee. In alle andere gevallen moet vraag 2 eerlijk met ja of nee beantwoord worden.
De kans dat iemand twee keer kop gooit (en dus antwoord op vraag 1 geeft) is 0,25. De kans op alle overige gevallen (kop - munt, munt - kop, of munt - munt), is 0,75.
Wanneer iemand ja antwoordt, zijn er twee mogelijkheden:
- De persoon heeft vraag 1 beantwoord (met een kans van 0,25) en is dus iemand die zijn handen altijd wast.
of
- De persoon heeft vraag 2 beantwoord (met een kans van 0,75) en is dus iemand die niet altijd zijn handen wast.
Dat betekent dus dat van de respondenten die ja antwoorden 25% een handenwasser is en 75% dat niet is. In formulevorm:
P(antwoord is ja) = 0,25 · P(wasser) + 0,75 · P(wasser)
Met deze formule (en twee muntjes) gaan we aan de slag en we enquêteren 500 mensen. Dit zouden de resultaten kunnen zijn:
225 mensen geven als antwoord ja.
275 mensen geven als antwoord nee.
Dat wil dus zeggen dat P(antwoord is ja) = 225/500 = 0,45. Invullen in de formule:
0,45 = 0,25 · P(wasser) + 0,75 · P(wasser)
We weten ook dat P(wasser) = 1 – P(wasser). Daaruit volgt dus:
0,45 = 0,25 · P(wasser) + 0,75 · (1 – P(wasser))
Hieruit kunnen de nu P(wasser), dat wil zeggen het deel van de ondervraagden dat altijd de handen wast, berekenen:
0,45 = 0,25 · P(wasser) + 0,75 – 0,75 · P(wasser)
–0,25 · P(wasser) + 0,75 · P(wasser)= 0,75 – 0,45
0,5 · P(wasser) = 0,3
P(wasser) = 0,6
60% van de ondervraagden uit dit voorbeeld wast altijd de handen na toiletbezoek.
Uit het antwoord (ja of nee) is dus niet meer af te leiden of vraag 1 of vraag 2 gesteld was. Wat we wel nog kunnen berekenen is de kans dat iemand zijn handen al dan niet wast, uitgaande van een bepaald antwoord. Zo kun je er dus bijvoorbeeld achter komen hoeveel procent van de ja-zeggers geen handenwasser is. Daarvoor gaan we de wet van Bayes gebruiken.
Deel 3 gaat over de wet van Bayes. Dit slotartikel zal ik binnenkort publiceren.
Ik heb deze artikelen gebaseerd op deze YouTube video van @JamesGrime.
2 gedachten over “Een gênante enquête - deel 2”