Skip to main content
main-content

Over dit boek

Dit boek bevat de meest relevante statistische methodologie en analysetechnieken voor wetenschappelijk onderzoek met patiënten en proefdieren. Het zal zijn waarde bewijzen bij de voorbereiding van onderzoek, bij de analyse van onderzoeksresultaten en bij het lezen van artikelen. Elk onderwerp wordt behandeld op een manier die aansluit bij de medische onderzoekspraktijk. Aan de hand van medische voorbeelden worden de mogelijkheden en beperkingen van statistische onderzoeksmethoden en analysetechnieken uitgelegd. Dit boek is bestemd voor studenten geneeskunde, studenten gezondheidswetenschappen en hbo-studenten gezondheidszorg (verpleegkunde, fysiotherapie, verloskunde). Naast studenten is het boek tevens geschikt voor huisartsen en kan het gebruikt worden als een betrouwbaar naslagwerk op een klinische afdeling. Leidinggevende onderzoekers, zoals promotoren, kunnen de inhoud van dit boek gebruiken om de kwaliteit van hun klinisch wetenschappelijk onderzoek te waarborgen.

Inhoudsopgave

Voorwerk

Hoofdstuk 1. Methodologie van Therapeutische Experimenten

Veronderstel dat een wetenschappelijk onderzoek moet uitwijzen wat de waarde is van een nieuwe therapie. Wanneer patiënten de nieuwe therapie krijgen toegediend, willen we ook weten hoe het deze patiënten zou vergaan zonder de nieuwe therapie. Maar het verloop zonder therapie, of met de oude therapie, zal zelden nauwkeurig vaststaan. Daarom moet de groep patiënten die de nieuwe therapie krijgen worden vergeleken met een controle groep patiënten die de nieuwe therapie niet krijgen. Er wordt dan verondersteld dat beide groepen aan het begin dezelfde prognose hebben. In de körnende paragrafen wordt uitgelegd hoe lastig het is om een wetenschappelijk verantwoorde vergelijking tussen verschillende behandelingen te maken. Er wordt uitgelegd dat een lotingsprocedures noodzakelijk is om goed vergelijkbare groepen te vormen en dat de goede vergelijkbaarheid moet worden gehandhaafd met het ‘intention to treat’ principe en blindering. Ook wordt enige aandacht besteed aan de ethische kanten van experimenteel onderzoek.

Hubert J. A. Schouten

Hoofdstuk 2. Predictieve Waarden van een Diagnostische Test

De uitslag van een diagnostische test kan fout-positief of fout-negatief uitvallen. De sensitiviteit is de kans op een positieve testuitslag bij zieke mensen en de specificiteit is de kans op een negatieve testuitslag bij gezonde mensen. Belangrijker voor de medische praktijk zijn de voorspellende waarden van een positieve of negatieve testuitslag, d.w.z. de kansen dat een tot stand gekomen testuitslag correct aangeeft of iemand ziek of gezond is. De predictieve waarden hangen af van de sensitiviteit en specificiteit van de onderzochte diagnostische test, maar ook van de prevalentie van de betreffende ziekte; in vraagstuk l wordt een huisartsenpraktijk vergeleken met een specialistenpraktijk. Ook de aannemelijkheidsverhouding (Engels: likelihood ratio) van een testuitslag wordt besproken. Het voorbeeld in de laatste paragraaf van dit hoofdstuk bevat drie ziekte-klassen en drie mogelijke testuitslagen.

Hubert J. A. Schouten

Hoofdstuk 3. Overeenstemming bij Medische Beoordelingen

Wanneer een patiënte door een arts wordt onderzocht, is het wenselijk dat de bevindingen (diagnose, Symptomen) niet anders uitvallen dan wanneer zij door een andere arts wordt onderzocht. Het boezemt geen vertrouwen in als artsen onderling ernstig van mening verschillen. Ze kunnen dan immers niet allemaal gelijk hebben. In experimenteel onderzoek kunnen verschillen tussen therapieën onduidelijk blijven door een onbetrouwbare beoordeling van het bereikte effect, maar ook door een onbetrouwbare beoordeling van toelatingscriteria en belangrijke prognostische factoren. In niet-experimenteel onderzoek moet rekening worden gehouden met de belangrijkste prognostische factoren, maar de daarvoor beschikbare statistische technieken werken alleen goed als deze prognostische factoren (vrijwel) foutloos kunnen worden vastgesteld. De waarde van beoordelingen, zowel voor de dagelijkse medische praktijk als voor wetenschappelijk onderzoek, kan aanzienlijk toenemen wanneer de onderlinge overeenstemming tussen beoordelaars merkbaar wordt verbeterd, ofschoon zelfs volledige overeenstemming tussen beoordelaars niet garandeert dat de betreffende beoordelingen enige waarde hebben.

Hubert J. A. Schouten

Hoofdstuk 4. Normale Verdeling

Verdeling van het steekproef gemiddelde, Betrouwbaarheids-interval voor het populatie gemiddelde, Predictie-interval voor individuele waarden: Referentie-waarden

Dit hoofdstuk heeft betrekking op kwantitatieve metingen aan mensen of proefdieren, zoals bloeddruk, cholesterol in bloed, temperatuur, hartfrequentie, lengte, gewicht en leeftijd.

Hubert J. A. Schouten

Hoofdstuk 5. Gemiddeld Verschil Tussen Gepaarde Waarnemingen

Meetmethoden vergelijken, Reproduceerbaarheid van Metingen, Keuze tussen Gepaarde t-toets en Wilcoxon rang-teken toets

Er zijn gepaarde waarnemingen als steeds twee waarnemingen iets gemeenschappelijk hebben waardoor beide waarnemingen niet volledig onafhankelijk van elkaar zijn. Voorbeelden zijn: de bloeddruk in het linker en rechter been, de verbetering van psoriasis aan de linker en rechter arm, in de tijd herhaalde metingen. Als het behandelingseffect van de tijd van het jaar afhangt, zijn er gepaarde waarnemingen wanneer twee proefdieren (of twee patiënten) op dezelfde dag in een onderzoek komen (en verschillend behandeld worden); het is in uw voordeel de onderzoeksopzet daarop af te stemmen omdat dit de eenvoudigste manier is om met prognostische factoren rekening te houden. De statistische technieken voor gepaarde waarnemingen gaan zelf na hoe sterk of zwak het verband tussen de gepaarde waarnemingen is, dat is keurig ingebouwd, en dit rechtvaardigt de volgende aanbeveling: wanneer het onduidelijk is of er gepaarde waarnemingen zijn, kies dan voor de zekerheid statistische technieken voor gepaarde waarnemingen.

Hubert J. A. Schouten

Hoofdstuk 6. Verschil in Gemiddelde tussen Twee Groepen

Behandelingen Vergelijken, Log Transformatie, Meerdere Uitkomstmaten, Twee-steekproeven t-toets of Wilcoxon-Mann–Whitney rangsom toets

In een therapeutisch experiment kan het gemiddelde effect, bijvoorbeeld de gemiddelde bloeddrukdaling, van twee behandelingen worden vergeleken. In dit hoofdstuk zijn er steeds twee

onafhankelijke groepen:

niemand komt in beide groepen voor. Bovendien wordt een patiënt slechts één keer tot het experiment toegelaten, zodat niemand meermalen in dezelfde groep zit.

Hubert J. A. Schouten

Hoofdstuk 7. Gemiddeld Verschil Tussen Gepaarde Waarnemingen in een Kruisproef, Gecorrigeerd voor Periode-Effect

In een kruisproef (Engels: cross-over trial) krijgt iedere patiënt beide te vergelijken behandelingen, in een door loting bepaalde volgorde. Omdat per patiënt beide behandelingsresultaten kunnen worden vergeleken, is de statistische toets veel gevoeliger dan als er twee aparte groepen zijn en elke patiënt één behandeling krijgt. Dit heeft tot gevolg dat, ruwweg, slechts een kwart van het aantal patiënten nodig is. Er zijn echter methodologische problemen en daarom mag u niet lichtvaardig tot een kruisproef besluiten.

Hubert J. A. Schouten

Hoofdstuk 8. Fractie Succes in één Groep en Verschil in Fractie Succes bij Gepaarde Waarnemingen

Dichotome Waarnemingen in één Groep

Het succes van een behandeling kan bestaan uit genezing, substantiële verbetering of het stoppen van verdere achteruitgang bij een patiënt. Voor elk individu, patiënt of proefdier zijn er

twee mogelijkheden (dichotomie of binaire variabele):

succes of mislukking, wel of niet overleven, enz. Een betrouwbaarheidsinterval voor de kans π op succes geeft aan hoe precies deze kans kan worden geschat uit de waargenomen fractie p succesvol behandelde patiënten in een onderzoek. Natuurlijk zijn de beschreven statistische methoden ook van toepassing op de kans op mislukking.

Hubert J. A. Schouten

Hoofdstuk 9. Verschil in Fractie Succes tussen Twee Groepen

Dichotome Waarnemingen in Twee Onafhankelijke Groepen

In een therapeutisch experiment kan worden onderzocht of de ene behandeling een grotere kans op succes heeft dan de andere behandeling. Bij succes van een behandeling kan worden gedacht aan genezing, maar ook aan een duidelijke verbetering, het vertragen van verdere achteruitgang of overleving na een van tevoren afgesproken tijdsduur. Er zijn voor elk individu

twee mogelijkheden (dichotomie of binaire variabele):

succes of mislukking, wel of niet overleven, enz. In dit hoofdstuk zijn er steeds twee

onafhankelijke groepen:

niemand zit in beide groepen. Bovendien komt niemand meer dan eens in dezelfde groep voor, omdat een individu slechts één keer tot een onderzoek wordt toegelaten. De onderzoeksopzet moet ervoor zorgen dat de waarnemingen statistisch onafhankelijk zijn, omdat dit wordt verondersteld in de berekening van een standaardfout, P-waarde of betrouwbaarheidsinterval.

Hubert J. A. Schouten

Hoofdstuk 10. Overlevingskansen uit Gecensureerde Tijdsduren

De kans op een ernstige gebeurtenis, bijvoorbeeld sterfte, hangt vaak af van de vervolgduur van de individuele patiënt

Omdat patiënten op verschillende momenten een onderzoek binnen komen, varieert de vervolgduur sterk van patiënt tot patiënt.

In vervolgstudies kan de tijdsduur vanaf een zeker begintijdstip tot een zeker eindtijdstip worden gebruikt. Voorbeelden zijn de tijdsduur vanaf een eerste infarct tot een recidief-infarct, of in een experiment de tijdsduur vanaf de loting tot het optreden van een ernstige gebeurtenis. Daarbij kunnen de volgende vragen van belang zijn. Verschilt de onderzochte tijdsduur tussen behandelingsgroepen? Wat is de prognostische waarde van (een combinatie van) bepaalde factoren?

Hubert J. A. Schouten

Hoofdstuk 11. Aantal Mensen of Proefdieren

In een Experiment met Twee Groepen

In dit hoofdstuk wordt aangegeven hoe groot een experiment moet zijn om een statistisch significant verschil tussen twee

onafhankelijke groepen

te mogen verwachten. Therapeutische experimenten worden in de komende paragrafen als voorbeeld genomen, maar de rekenformules zijn natuurlijk ook toepasbaar bij de voorbereiding van andere experimenten. Hoeveel individuen in het experiment moeten worden opgenomen kan pas worden berekend nadat de onderzoeker de volgende besluiten in het

onderzoeksprotocol

heeft vast gelegd:

Op vakinhoudelijke gronden moet de onderzoeker het belangrijkste evaluatie-criterium kiezen: aangegeven moet worden hoe elk individu wordt geëvalueerd. Gedacht kan worden aan het wel/niet succes hebben van de therapie of aan de mate waarin een patiënt verbetert.

De onderzoeker moet het kleinste verschil in effectiviteit vaststellen dat nog medisch relevant is. Gedacht kan worden aan een kleinste verschil in succeskans dat statistisch te bewijzen moet zijn, of aan een te verwachten verschil in gemiddelde dat niet over het hoofd mag worden gezien.

De statistische toets moet worden gekozen: twee fracties zullen worden vergeleken met de chi kwadraat toets, of twee gemiddelden zullen worden vergeleken met de t-toets. Bovendien moeten de significantie-grens (meestal 0,05) en de gevoeligheid (bijvoorbeeld 0,90) worden gekozen. De onderzoeker moet ook beslissen of tweezijdig dan wel éénzijdig zal worden getoetst; aan het einde van paragraaf 11.1 wordt uitgelegd dat bijna altijd tweezijdig dient te worden getoetst.

Hubert J. A. Schouten

Hoofdstuk 12. Interim Analyses: Tussentijds Statistisch Toetsen

Om ethische redenen kan het wenselijk zijn een therapeutisch experiment te beëindigen zodra een statistisch significant verschil in behandelingsresultaat is bereikt. Daarna kunnen alle patiënten de beste behandeling krijgen. In de paragrafen 12.2 en 12.3 beschrijf ik de bekende stopregels van Pocock en van O’Brien en Fleming. In de paragrafen 12.4 en 12.5 beschrijf ik de recent ontwikkelde stopregels van Snapinn. De stopregels van Snapinn laten ook toe om een therapeutisch experiment te beëindigen zodra een statistisch significant verschil niet langer te verwachten is. Er hoeft dan niet langer tijd en geld te worden verspild aan een experiment waarvan de conclusie reeds bekend is.

Hubert J. A. Schouten

Hoofdstuk 13. Data Management: Fouten Voorkomen en Opsporen

De betrouwbaarheid van de conclusies uit een wetenschappelijk onderzoek hangt sterk af van de betrouwbaarheid van de verkregen gegevens. Als sommige gegevens fout zijn of ontbreken, doet dit afbreuk aan de geloofwaardigheid van de conclusies. In paragraaf 13.1 worden aanwijzingen gegeven om fouten te voorkomen. In paragraaf 13.2 worden de belangrijkste controles genoemd die u moet uitvoeren om een betrouwbaar gegevensbestand (Engels: data base) te verkrijgen. Het is onverantwoord om dergelijke controles achterwege te laten.

Hubert J. A. Schouten

Hoofdstuk 14. Chi Kwadraat Toetsen

In dit hoofdstuk worden de belangrijkste chi kwadraat toetsen behandeld. In paragraaf 14.1 wordt getoetst of een waargenomen frequentie-verdeling van bloedgroepen past bij de kansverdeling volgens de wetten van Mendel. In paragraaf 14.2 wordt statistisch getoetst of vier verschillende vaccins dezelfde kans geven om vrij van mazelen te blijven. Omdat er zes paarsgewijze vergelijkingen zijn, worden ook de Bonferroni en de Hochberg gecorrigeerde P-waarden berekend. In paragraaf 14.3 wordt onderzocht of de kans op coronair vaatlijden significant toeneemt met de leeftijd, waarbij de leeftijd in klassen is ingedeeld.

Hubert J. A. Schouten

Hoofdstuk 15. Lineaire Regressie

Normale Afhankelijke Variabele

Aan een mens of dier kunnen kwantitatieve metingen worden verricht, zoals bloeddruk, spierkracht, intelligentie, of bestendigheid tegen mentale spanningen. Ook kunnen kwalitatieve gegevens worden verzameld, zoals wel of niet roken, geslacht of medische behandeling. Met lineaire regressie analyse kan worden beschreven hoe een kwantitatieve meting afhangt van andere gegevens; deze andere gegevens kunnen zowel kwantitatieve als kwalitatieve gegevens zijn. In dit hoofdstuk zal ik dit nader verduidelijken. Daarbij ga ik ervan uit dat het ingewikkelde rekenwerk aan de computer wordt overgelaten.

Hubert J. A. Schouten

Hoofdstuk 16. Logistische Regressie

Dichotome Ajhankelijke Variabele

Het wordt toegepast in differentiaal-diagnostiek, in experimenteel en in etiologisch onderzoek. Kenmerkend is dat de

afhankelijke variabele een dichotomie

is: ja/nee, wel/niet (genezen), ziek/gezond of succes/mislukking. Uit een regressie score S wordt een kans p berekend.

Hubert J. A. Schouten

Hoofdstuk 17. Aantal Mensen of Proefdieren in Twee Groepen, II

Dit hoofdstuk is een vervolg op hoofdstuk

11

. Er wordt aangegeven hoe groot twee experimentele groepen moeten zijn om een statistisch bewijs te kunnen leveren voor een systematisch verschil tussen deze groepen. Het vereiste aantal individuen hangt niet alleen af van de opzet van een experiment, maar ook van de wijze waarop de gegevens zullen worden geanalyseerd. Bij het vergelijken van twee onafhankelijke gemiddelden kan een voormeting het vereiste aantal individuen flink reduceren; herhaling van metingen kan het aantal individuen verder omlaag brengen. Voor een kruisproef zijn aanzienlijk minder patiënten nodig. Bij het vergelijken van overlevingsduren zijn minder patiënten nodig naarmate de patiënten langer worden vervolgd. Tenslotte wordt enige aandacht besteed aan niet-experimenteel onderzoek.

Hubert J. A. Schouten

Hoofdstuk 18. Schema’s voor het Kiezen van een Statistische Toets

De schema’s in dit hoofdstuk geven een indruk van de meest gebruikte statistische toetsen voor het vergelijken van gemiddelden, medianen of fracties (geschatte kansen). In elk schema moet een rij en een kolom worden gekozen. Vaak is het ook mogelijk om een betrouwbaarheidsinterval te berekenen. Zowel toets als interval kunnen zinvol zijn.

Hubert J. A. Schouten

Hoofdstuk 19. Methodologie Van Wetenschappelijk Onderzoek

Dit hoofdstuk is een vervolg op hoofdstuk

1

. In de eerstvolgende paragraaf wordt aandacht besteed aan regressie naar het gemiddelde. Patiënten bij wie een nogal hoge bloeddruk werd gemeten vertonen ook zonder behandeling een schijnbare verbetering. Naarmate de oorspronkelijke bloeddruk hoger was is de schijnbare verbetering groter. Dit fenomeen, van regressie naar het gemiddelde, kan een forse bijdrage leveren aan het placebo-effect. Wanneer regressie naar het gemiddelde op kan treden, is het volkomen zinloos om een meting voor en na de behandeling met elkaar te vergelijken in een statistische toets. In een therapeutisch experiment, met een lotingsprocedure, kan de voormeting het beste als covariaat worden gebruikt.

Hubert J. A. Schouten

Hoofdstuk 20. Onderzoeksprotocol voor een Therapeutisch Experiment

Een goed onderzoeksprotocol is een volledige handleiding voor de organisatie en uitvoering van een onderzoek, inclusief de analyse en de verslaglegging. Het protocol moet alle belangrijke afspraken bevatten, zodat niets over het hoofd wordt gezien. Een bondig protocol is bovendien een goede basis voor een eerste versie van het artikel of proefschrift waarin het experiment wordt beschreven. De belangrijkste besluiten betreffen:

het type patiënt dat in het onderzoek zal worden opgenomen en hoe dergelijke patiënten kunnen worden geworven en geselecteerd

de te vergelijken behandelingen

de wijze waarop het behandelingsresultaat bij een patiënt zal worden vastgesteld

de wijze waarop het behandelingsresultaat in elke behandelingsgroep zal worden samengevat; denk aan grafieken en tabellen

de statistische toets om de behandelingsgroepen met elkaar te vergelijken

het aantal patiënten en waarom dit aantal patiënten nodig is

Hubert J. A. Schouten

Nawerk

Meer informatie