Skip to main content
main-content
Top

Tip

Swipe om te navigeren naar een ander artikel

01-06-2018 | Psychodiagnostiek | Uitgave 3/2018

GZ - Psychologie 3/2018

Waarom iedere psycholoog de regel van Bayes moet kennen

Tijdschrift:
GZ - Psychologie > Uitgave 3/2018
Auteurs:
Bea Tiemens, Renée Wagenvoorde, Cilia Witteman
Belangrijke opmerkingen
Prof.dr. Bea Tiemens is bijzonder hoogleraar Evidence based practice in mental health care aan het Behavioural Science Institute, Radboud University, Nijmegen. Ze leidt het onderzoeksprogramma van Indigo en is senior onderzoeker bij Pro Persona Research. Tiemens promoveerde in 1999 aan de Rijksuniversiteit Groningen op de herkenning, diagnostiek en behandeling van psychische problematiek in de huisartsenpraktijk. Haar onderzoek is gericht op methodische en evidence based indicatiestelling, systematisch monitoren en kosteneffectiviteit in de ggz.
Dr. Renée Wagenvoorde is docent Statistiek en Methoden aan de Radboud Universiteit Nijmegen en is als research fellow verbonden aan The Centre for Religion, Conflict and Globalization. Ze behaalde haar PhD aan de Rijksuniversiteit Groningen in 2015, met een onderzoek naar de relatie tussen religie en goed burgerschap. Haar onderzoek kenmerkt zich door interdisciplinariteit, waarbij ze grootschalig kwantitatief onderzoek combineert met kwalitatief, politiek-filosofisch en/of beleidsonderzoek naar maatschappelijk actuele thema’s.
Prof.dr. Cilia L.M. Witteman is hoogleraar Psychodiagnostiek, in het bijzonder diagnostische besluitvorming aan het Behavioural Science Institute, Radboud University, Nijmegen. Ze is ex-voorzitter van de European Association for Decision Making. In 1992 behaalde ze haar PhD aan de Universiteit Utrecht, op studies naar klinisch redeneren. Haar onderzoek is gericht op beoordelingen en besluitvorming toegepast op professionals in de geestelijke gezondheidszorg en forensische situaties, en op de ontwikkeling van klinische intuïtie.
Stel, u werkt in de Generalistische Basis GGZ en een patiënt is door de huisarts verwezen vanwege een verhoogde score op een depressievragenlijst. In die huisartspraktijk heeft 11% van de patiënten een depressie (de prevalentie). Als een patiënt een depressie heeft, is de kans dat die patiënt positief scoort op deze depressielijst 83% (sensitiviteit). Bij een patiënt die geen depressie heeft, is de kans om negatief op de lijst te scoren 80% (specificiteit) en de kans om toch positief op depressie te scoren 20% (kans op fout-positieve uitslag). Hoe groot is de kans dat de verwezen patiënt een depressie heeft? (geef een antwoord voor u verder leest).
Psychologen leren tijdens hun studie hoe deze vraag beantwoord kan worden. Je moet daarvoor (inderdaad) rekening houden met de sensitiviteit en specificiteit van een psychologische test, maar wat moet je ook alweer doen met die prevalentie van 11%? Daarop passen we de regel van Bayes toe, via een nogal ingewikkelde formule. Menig behandelaar zal in de praktijk denken: ‘dat hoef ik niet uit te rekenen, want als deze patiënt hoog scoort op een depressievragenlijst is de kans op een depressie toch vrij groot?’ Maar met het negeren van de regel van Bayes kun je de plank volkomen misslaan, en het kan met name leiden tot overdiagnostiek.

Overdiagnostiek

Van overdiagnostiek weten we niet precies hoe vaak het in de praktijk voorkomt. Patiënten die overgediagnosticeerd worden, zullen daarover namelijk niet snel klagen. Ze weten het niet, knappen snel op, of worden uitgebreid behandeld en constateren dat het goed is dat de arts het zo snel heeft gezien. Bij onderdiagnostiek daarentegen, wordt er een ziekte gemist met mogelijk zelfs de dood tot gevolg, zoals bij het niet (tijdig) opmerken van een agressieve vorm van kanker. In het algemeen zijn zorgprofessionals daarom banger om een ziekte te missen dan dat zij vrezen voor overdiagnostiek. Toch wordt door met name epidemiologen, maar ook door huisartsen, regelmatig gewaarschuwd voor overdiagnostiek. Risico’s van overdiagnostiek moeten bijvoorbeeld goed worden afgewogen bij toepassing van screeningsprogramma’s, zoals darmkankerscreening, omdat het onderzoek na de screening absoluut niet zonder risico is. 1 Maar ook bij borstkankerscreening, een programma dat al zo lang loopt in Nederland, worden regelmatig vraagtekens gezet, onder andere na recente Deense en Nederlandse studies naar overdiagnostiek. 2, 3 Ivan Wolffers schrijft hierover: ‘Voor elke vrouw bij wie de borstkanker op tijd gevonden wordt, zullen er tien vrouwen voor niets behandeld worden (dus borst verwijderen, bestralen, chemotherapie en alle andere ellende)… Gelukkig weten ze het niet. Dus niemand kan erover klagen.’ 4

Overdiagnostiek in de ggz

En hoe zit dat in de ggz? Een discussie over de risico’s van overdiagnostiek barste vooral los bij de invoering van de nieuwe versie van onze diagnostische bijbel, de DSM-5. Zo schreef Allen Frances een boek over de epidemie van psychische stoornissen, de diagnostische inflatie en de overbehandeling met o.a. medicatie. 5 Onderzoeker Laura Batstra strijdt al jaren tegen de overdiagnostiek van ADHD. 6 Cijfers over overdiagnostiek in de dagelijkse behandelpraktijk bestaan er wonderlijk genoeg vooral over overdiagnostiek door huisartsen. Veel is geschreven over de onderdiagnostiek van met name depressie door huisartsen. In een meta-analyse werd 50% van de depressies gemist en bij iets minder dan 20% van de patiënten die geen depressie hadden, stelden de huisartsen toch een depressie vast. 7 In absolute aantallen betekent dit dat meer patiënten ten onrechte de diagnose depressie kregen dan dat er depressies werden gemist. Aangezien er nauwelijks onderzoek naar is gedaan, zouden we haast veronderstellen dat overdiagnostiek in de ggz niet voorkomt, dat de meeste psychologen het simpelweg prima doen. Dat is alleen aannemelijk als de kennis over de risico’s van overdiagnostiek overal stevig verankerd is.

Bayes in studie en opleiding

Psychologen leren de regel van Bayes tijdens hun universitaire opleiding, maar in het standaard lesmateriaal voor psychologen vinden we er weinig over terug. Neem het Handboek voor gz-psychologen 8 ; daarin komt de regel van Bayes bijvoorbeeld niet eens aan de orde, en in de hoofdstukken over diagnostiek wordt evenmin gewaarschuwd voor overdiagnostiek. Dit geldt ook voor de Algemene Standaard Testgebruik van het NIP. 9 Wel vermelden de auteurs van dit laatste werk dat ‘Psychodiagnostische instrumenten worden ingezet wanneer redelijkerwijs verwacht kan worden dat met deze instrumenten de kwaliteit van een advies of uitspraak over een persoon of groep van personen toeneemt.’ De woorden ‘redelijkerwijs’ en ‘kwalitatief’ neigen naar kwalificaties op basis van het Fingerspitzengefühl van de psycholoog. Wij denken dat patiënten daarmee te kort worden gedaan. Zoals we hieronder illustreren, was het beter geweest wanneer de auteurs in plaats daarvan schreven: ‘Psychodiagnostische instrumenten worden ingezet als hiermee de zekerheid over een advies of uitspraak toeneemt; d.w.z. als de kans op de aanwezigheid of afwezigheid van de onderzochte aandoening binnen de setting waarin wordt getest hiermee toeneemt.’

De regel van bayes

De regel van Bayes, ook wel theorema van Bayes genoemd, helpt ons om de kans op een aandoening te bepalen bij een individu; gegeven de prevalentie van die aandoening in de populatie waar dat individu deel van uitmaakt, de uitkomst op een test en de psychometrische kenmerken van die test. De populatie is essentieel in de regel van Bayes, maar juist die wordt vaak vergeten. Als een aandoening namelijk weinig voorkomt in een populatie (lage prevalentie), dan zal een positieve testuitslag weliswaar uitwijzen dat bij het geteste individu sprake is van een verhoogde kans op de aandoening, - hoger dan voor de testafname -, maar die kans is gezien de populatie dan toch nog steeds heel laag. Met andere woorden: dezelfde testuitslag in verschillende populaties geeft een andere kans op de geteste aandoening. Dit is intuïtief lastig te begrijpen, zelfs als je bekend bent met de regel van Bayes. Denk bijvoorbeeld aan het testen op een tropische ziekte; in Nederland is de kans dat een positieve testuitslag daarvan op puur toeval berust veel groter dan in de tropen, omdat de prevalentie in Nederland veel lager is. Voor ons begrip helpt het om bij elke testuitslag zelf het bijbehorende rekensommetje te maken. 10 Hieronder laten we zien dat de formule van Bayes misschien lastig is, maar dat dit rekensommetje kinderlijk eenvoudig is.

Rekensom: heeft de cliënt een depressie?

Om terug te komen op ons eerdere voorbeeld: de kans dat een huisarts een patiënt met een depressie ziet, is 11%; dit is de prevalentie (prev.) in de spreekuurpopulatie. Dit wordt ook wel de base rate, basiskans of voorafkans genoemd; de kans op het hebben van de aandoening voordat er wordt getest ( Beste lezer, niet afhaken nu, het wordt echt gemakkelijk).
In het bovenste deel van figuur 1 wordt eerst deze kans op een depressie weergegeven, daaronder staat de kans dat een patiënt met een depressie ook daadwerkelijk positief scoort op een depressievragenlijst (sensitiviteit, 83%), en de kans dat een patiënt zonder depressie daarop negatief scoort (specificiteit, 80%). Deze kanscijfers zijn gebaseerd op het onderzoek van Cameron en collega’s die drie depressievragenlijsten hebben getest in huisartsenpraktijken. 11 Uit dit onderzoek gebruiken we de meest gunstige waarden voor de sensitiviteit (Se) en specificiteit (Sp) van de Beck Depression Inventory II (BDI-II) 12 .
Onder het schema in figuur 1 staat de formule van Bayes. De P staat voor ‘probability’ oftewel kans. Het verticale streepje betekent ‘onder de voorwaarde dat’ of ‘gegeven’. Dus P(D+|T+) betekent de kans (P) dat de patiënt een depressie heeft (D+), gegeven (|) een positieve testuitslag (T+) op een depressievragenlijst. Om die kans te achterhalen, gebruiken we de formule van Bayes:
  • P(T+|D+) is de kans dat een patiënt met een positieve test een depressie heeft, dus de sensitiviteit, hier 0,83.
  • P(D+) is de kans dat een patiënt in deze populatie een depressie heeft, de prevalentie, hier 0,11.
  • P(T+|D-) is de kans dat een patiënt met een positieve test geen depressie heeft, dus 1-specificiteit (de kans dat een patiënt met een negatieve test geen depressie heeft), hier 1-0,8=0,2.
  • P(D-) is de kans dat een patiënt in deze populatie geen depressie heeft, 1-prevalentie, hier 1-0,11=0,89.
We hebben nu alle benodigde gegevens om de formule van Bayes in te vullen:
Slotsom: de kans (P) dat de verwezen patiënt uit de desbetreffende huisartspraktijkpopulatie een depressie heeft, - (D+) gegeven (|) een positieve testuitslag (T+) op een depressievragenlijst -, P(D+|T+) is ongeveer een derde, 34%. Dit wordt ook wel de achterafkans genoemd, het is immers de kans nadat de test is afgenomen, gegeven de uitkomst van de test.

Het kan makkelijker

Voor het toepassen van de formule van Bayes moet je even puzzelen, en deze is lastig te onthouden. Het is echter simpeler als dezelfde informatie in absolute aantallen in plaats van kansen wordt weergegeven 13 , zoals in figuur 2.
Boven staat de informatie in eenzelfde stroomdiagram als in figuur 1, en onder staat deze informatie in een kruistabel, maar nu in absolute aantallen. Met de sensitiviteit van de test is berekend hoeveel patiënten met een depressie positief zullen scoren: 0,83 x 110 = 91,3, afgerond 91. Dus 110 – 91 = 19 patiënten met een depressie scoren negatief op de depressietest. Met de specificiteit is berekend hoeveel patiënten zonder depressie negatief scoren op de test: 0,80 x 890 = 712. Dus 890 – 712 = 178 patiënten die geen depressie hebben, zullen toch positief op de depressietest scoren. Op deze wijze wordt in een oogopslag duidelijk hoeveel patiënten een positieve test hebben gescoord (91 + 178), en hoeveel van hen daadwerkelijk een depressie hebben (91). De kans dat de patiënt gegeven een positieve test een depressie heeft, is dus:
De kans dat de patiënt gegeven een negatieve test geen depressie heeft, is:

Sensitiviteit en specificiteit

Hoewel de sensitiviteit van de BDI in het onderzoek van Cameron et al. 83% is en de specificiteit 80%, is de kans dat de patiënt bij een positieve testuitslag daadwerkelijk een depressie heeft veel minder hoog, namelijk slechts eenderde; veel te laag voor een behandelindicatie. Een negatieve testuitslag daarentegen, geeft bij de test in deze populatie vrij veel zekerheid over de afwezigheid van een depressie en is hoger dan de specificiteit. Deze test zou dus wel gebruikt kunnen worden om een depressie uit te sluiten.
Uit voorgaande blijkt dat er niet eenvoudigweg vertrouwd kan worden op de testscore. Een positieve test wil niet per definitie zeggen dat de aandoening ook aanwezig is, en een negatieve testuitslag betekent niet per definitie dat deze afwezig is. Ook kan niet vertrouwd worden op de sensitiviteit of ‘pakkans’ en op de specificiteit van een instrument. Want bij een hele lage prevalentie kunnen de sensitiviteit en specificiteit nog zo hoog zijn, maar ook dan is de kans op de aandoening bij een positieve testuitslag nooit hoog.
Dit wordt duidelijk als we met dezelfde depressietest, met dezelfde sensitiviteit en specificiteit, de bevolking screenen, waaronder de prevalentie van depressie lager is dan in de huisartspraktijk, namelijk 5%. De kans op een depressie bij een positieve test is dan minder dan 20% (figuur 3): 42/(42+190)=0,18. En stel dat in de situatie van figuur 3, de specificiteit niet 80% is maar 95%; het aantal cliënten zonder depressie dat positief scoort is dan 48. De achterafkans wordt dan veel beter, - 42/(42+48)=0,47 -, maar deze is nog steeds lager dan 50%.

Onderzoek versus praktijk

De cijfers uit de voorbeelden laten zien waarom we de regel van Bayes ook in de praktijk altijd in het achterhoofd zouden moeten hebben. Bij het berekenen van de sensitiviteit en specificiteit van een test in wetenschappelijk onderzoek is bekend welke respondenten de aandoening wel en niet hebben. In de praktijk geldt dat niet, daarom wordt er juist getest. De psycholoog ziet alleen een positieve testuitslag! In het volgende voorbeeld is dat het geval bij 23% (42+190/1000) van de mensen, terwijl maar 5% een depressie heeft. De psycholoog weet niet wie van die 23% nu wel of niet een depressie heeft. Maar als hij of zij zich bewust is van de regel van Bayes, is duidelijk dat er naast het afnemen van een BDI extra diagnostisch onderzoek moet worden gedaan. Dit geldt ook voor het testen in de huisartspraktijk, waar in ons voorbeeld de kans op een depressie - gegeven een positieve test - 34% was. Stel dat een psycholoog bij alle patiënten die positief scoren (zie figuur 2: 91 + 178=269), een psychiatrisch interview zou afnemen met een sensitiviteit van 80% en een specificiteit van 90%; we krijgen dan een heel ander beeld omdat de groep waarmee we startten (die 269) een veel hogere prevalentie heeft, namelijk die 34%. Figuur 4 laat zien dat de achterafkans nu veel hoger is, namelijk 73/91=0,80. Bij het toevoegen van een tweede test stijgt dus de achterafkans van 34% naar 80%.
De regel van Bayes helpt ons om de achterafkans op een aandoening te bepalen; gegeven de testuitslag, de voorafkans (de prevalentie), de sensitiviteit en de specificiteit van het diagnostisch instrument. Als we vergeten om de voorafkans mee te wegen, en er slechts wordt gekeken naar de sensitiviteit van een test, dan wordt een positieve score geïnterpreteerd als de aanwezigheid van de aandoening. Hoe gemakkelijk maar ook onjuist deze conclusie is, en hoezeer we patiënten hiermee tekortdoen, mag de lezer nu duidelijk zijn.

De hamvraag

Wat betekent het in de praktijk als behandelaars zich bewust zijn van de regel van Bayes? Dit betekent dat zij bij het beoordelen van een testuitslag altijd moeten vaststellen in welke setting de test is afgenomen. Met andere woorden: de inschatting van de kans op de aanwezigheid van een aandoening begint dus altijd bij het vaststellen of inschatten van de prevalentie in de populatie of setting waarin de test is uitgevoerd.
Mogelijk vraagt u zich nu af hoe u die prevalentie kunt weten, of waar u die kunt vinden. Inderdaad, dat is de hamvraag. De prevalentie van de meest voorkomende psychische aandoeningen op bevolkingsniveau zijn te vinden in het landelijke Nemesis-onderzoek, waarvan de publicatie gratis te downloaden is. 14, 15 De meeste gz-psychologen werken echter niet op bevolkingsniveau, relevanter zijn de prevalenties in de huisartspraktijk of ggz (Generalistische Basis GGZ of Specialistische GGZ).
De meeste prevalentiecijfers voor de huisartspraktijk zijn gebaseerd op de registratie door de huisarts. We weten echter dat die prevalentie op basis van registraties in het algemeen een onderschatting is. De prevalenties in de huisartsrichtlijnen 16 , zijn bijvoorbeeld lager dan de prevalenties op bevolkingsniveau. Omdat in Nederland bijna iedereen een huisarts heeft, zou de prevalentie in de huisartspopulatie echter vergelijkbaar moeten zijn met de prevalentie op bevolkingsniveau. Huisartspatiënten met een depressie bezoeken hun huisarts echter vaker dan huisartspatiënten zonder depressie. Onder de patiënten die op het spreekuur komen, is de prevalentie dus hoger. Een grove richtlijn hiervoor is de prevalentie op bevolkingsniveau te verdubbelen. 17
De prevalentie van een psychische aandoening in de setting waarin u zelfwerkzaam bent, is het beste vast te stellen op basis van registraties in de eigen organisatie. Stel dat ongeveer eenderde van de patiënten die wordt aangemeld bij uw organisatie een depressie heeft; als u die prevalentie invult in het stroomdiagram en dezelfde sensitiviteit en specificiteit aanhoudt, dan is de kans na het testen van een willekeurige cliënt die positief scoort op de BDI verhoogd naar tweederde. De risico’s van overdiagnostiek zijn in de Specialistische GGZ daarom in het algemeen lager, maar ook daar kunnen zeldzame aandoeningen voorkomen. Omdat dit in een specialistische setting eerder opvalt, zal in een specialistische setting naar verwachting ook eerder extra diagnostiek worden gedaan.

Conclusie

Het negeren van de regel van Bayes leidt vooral bij aandoeningen die niet zoveel voorkomen (aandoeningen met een lage voorafkans) tot overdiagnostiek. Dit is goed te begrijpen door naar de stroomschema’s te kijken. Omdat het deel ‘geen aandoening’ dan heel groot wordt, zal zelfs bij een zeer goede specificiteit de achterafkans nog steeds laag blijven. Dit kan grote gevolgen hebben voor het behandelbeleid, en dus voor het beloop van de klachten van een cliënt. We adviseren daarom ten zeerste om het principe van Bayes te onthouden, namelijk dat de kans op een aandoening bij een positieve test afhankelijk is van de populatie en setting waarin daarop is getest. Als de formule van Bayes in de vergetelheid is geraakt, geen paniek. Het rekensommetje met de absolute aantallen is eenvoudig te maken. In het kader hieronder worden de te nemen stappen daarvoor samengevat. Rekenen met groepen van 100 of 1000 cliënten werkt verhelderend, dat geeft snel inzicht in de kans op een aandoening bij een score op een specifieke test.
STAPPEN BIJ HET BEOORDELEN VAN EEN TESTUITSLAG:
1.
bepaal de populatie van de geteste persoon en de setting waarin de test is afgenomen;
 
2.
zoek de prevalentie op van de te testen aandoening voor die populatie en setting;
 
3.
zoek de sensitiviteit en specificiteit van de test op in de handleiding van de test;
 
4.
zet de waarden in een stroomdiagram of kruistabel, zoals in figuur 2;
 
5.
bereken de kans op de aanwezigheid van de aandoening bij een positieve testuitslag, of de kans op afwezigheid van de aandoening bij een negatieve testuitslag.
 

Onze productaanbevelingen

BSL Psychologie Totaal

Met BSL Psychologie Totaal blijft u als professional steeds op de hoogte van de nieuwste ontwikkelingen binnen uw vak. Met het online abonnement heeft u toegang tot een groot aantal boeken, protocollen, vaktijdschriften en e-learnings op het gebied van psychologie en psychiatrie. Zo kunt u op uw gemak en wanneer het u het beste uitkomt verdiepen in uw vakgebied.

GZ-Psychologie

GZ-Psychologie is een onafhankelijk tijdschrift en richt zich geheel op de snelgroeiende beroepsgroep van gz-psychologen, waarvan er inmiddels meer dan 15.000 zijn. GZ-Psychologie wil de identiteit en ...

Literatuur
Over dit artikel

Andere artikelen Uitgave 3/2018

GZ - Psychologie 3/2018 Naar de uitgave

Nieuws uit de wetenschap

Nieuws uit de wetenschap