Dit artikel gaat over een zeer gevoelig onderwerp. We willen een groep mensen namelijk een vraag stellen waarop het antwoorden van ja erg gênant zou zijn, bijvoorbeeld “Peuter je wel eens in je neus?” Niet iedereen zal eerlijk antwoord geven op die vraag. Toch is mogelijk om te achterhalen hoeveel mensen ja zouden zeggen in het geval ze eerlijk zouden antwoorden.
Als je iemand de vraag over neuspeuteren direct zou stellen, dan zou het antwoord waarschijnlijk gelogen en nee zijn (tenzij je die persoon misschien heel goed kent). Hoe kun je er nu zeker van zijn dat je altijd een eerlijk antwoord krijgt? Daar gebruiken we een handige wiskundige truc voor! Een truc die door het Amerikaanse leger in de Vietnamoorlog al gebruikt werd om te achterhalen hoeveel van hun troepen wiet rookten. Deze techniek wordt Randomised response genoemd.
Randomised response
Stel je voor dat we bovenstaande vraag over neuspeuteren, waar het natuurlijk gênant is om ja op te antwoorden, aan 100 mensen stellen. Uiteindelijk willen we er achter komen hoeveel procent van die mensen ja zegt. Het gaat er dus niet om wie er ja zegt, maar hoeveel mensen dat zijn!
Je gaat dan als volgt te werk. Laat iedere deelnemer een muntje opgooien. Het resultaat (kop of munt) mag niemand verklappen. Afhankelijk van het resultaat moet elke respondent een van de volgende twee dingen doen.
Kop: geef ja als antwoord
Munt: beantwoord de vraag “Peuter je wel eens in je neus?” eerlijk met ja of nee
De ondervraagde persoon geeft dus alleen maar ja of nee als antwoord. Op welke vraag dit antwoord is gegeven, weet je echter niet!
Nadat je alle 100 mensen hebt ondervraagd, heb je dus de beschikking over 100 ja/nee antwoorden. Stel dat dit de resultaten zijn:
80 mensen geven als antwoord ja.
20 mensen geven als antwoord nee.
Omdat de kans dat je munt gooit gelijk is aan 0,5, kun je verwachten dat 50 mensen (de helft) munt hebben gegooid en dus antwoord op de gênante vraag hebben gegeven. De overige 50 mensen gaven het standaard antwoord ja, omdat ze kop worpen. Als je die 50 mensen even buiten beschouwing laat, dan hou je 80 – 50 = 30 mensen over die ja als antwoord hebben gegeven op vraag of ze neuspeuteren.
30 mensen geven als antwoord ja op de gênante vraag.
20 mensen geven als antwoord nee op de gênante vraag.
Van de 50 mensen zijn er dus 30 die in hun neus peuteren. En dat is 60%.
Dit was deel 1 van 3 uit de reeks over randomised response en de wet van Bayes. Deel 2 gaat over een bezwaar tegen bovenstaande aanpak: als iemand het antwoord nee geeft, weet je namelijk welke vraag is beantwoord. In het volgende deel leg ik uit hoe je dit kunt oplossen. Deel 3 gaat over de wet van Bayes. De volgende delen zal ik binnenkort publiceren.
Ik heb dit artikel gebaseerd op deze YouTube video van @JamesGrime.
Een gedachte over “Een gênante enquête - deel 1”