Toegepaste (para)medische statistiek
- 2026
- Boek
- Auteur
- J.W.R. Twisk
- Uitgeverij
- BSL Media & Learning
Over dit boek
Toegepaste (para)medische statistiek onderscheidt zich door zijn praktijkgerichte aanpak. Deze geheel herziene druk laat steeds zien hoe statistiek een hulpmiddel is om een wetenschappelijke onderzoeksvraag te beantwoorden. De nadruk ligt op gebruik en interpretatie: ingewikkelde wiskundige afleidingen zijn tot een minimum beperkt, terwijl de uitleg van de analyses helder en toegankelijk wordt gepresenteerd.
Online zijn de gebruikte datasets uit de voorbeelden in het boek beschikbaar, zodat studenten en onderzoekers zelf met de analyses kunnen oefenen en hun resultaten direct kunnen vergelijken.
Het boek is geschreven in het Nederlands om de vaak complexe materie zo begrijpelijk mogelijk te maken. Het sluit nauw aan bij het onderwijs in de Bachelor Geneeskunde van de Vrije Universiteit en bij de postinitiële Master Epidemiologie (EpidM). Daarmee is het niet alleen geschikt als studieboek voor bachelor- en masterstudenten in het (para)medische domein, maar ook als praktisch naslagwerk voor onderzoekers.
Auteur prof. dr. Jos Twisk, werkzaam als docent, consultant en onderzoeker aan de afdeling Epidemiologie en Datascience van het Amsterdam UMC, brengt zijn uitgebreide ervaring in onderwijs en onderzoek samen in dit toegankelijke en toepasbare handboek.
Inhoudsopgave
-
Voorwerk
-
1. Inleiding
J.W.R. TwiskSamenvattingHoewel dit boek niet (direct) gaat over het opzetten en uitvoeren van wetenschappelijk onderzoek, is het toch van belang om aandacht te besteden aan de verschillende onderzoeksvormen die veel gebruikt worden binnen het (para)medisch wetenschappelijk onderzoek. Dit heeft voornamelijk te maken met het feit dat het gebruik van bepaalde effectmaten (en soms ook het gebruik van statistische analyses) afhankelijk is van de gebruikte onderzoeksvorm. Grofweg kan (para)medisch onderzoek worden onderverdeeld in twee groepen: observationeel en experimenteel onderzoek. -
2. Beschrijvende statistiek
J.W.R. TwiskSamenvattingBeschrijvende statistiek heeft tot doel onderzoeksgegevens op een overzichtelijke manier samen te vatten. In dit hoofdstuk wordt onderscheid gemaakt tussen grafische weergave van onderzoeksgegevens, zoals histogrammen en stem and leaf-plots, en numerieke weergave van onderzoeksgegevens, zoals de frequentie, het gemiddelde en de mediaan. Daarnaast worden ook spreidingsmaten, zoals de standaarddeviatie en percentielpunten, besproken. Welke keuze we maken voor de weergave van de onderzoeksgegevens hangt af van de soort variabele (dichotoom, categoriaal of continu). Bij continue variabelen is ook van belang of de variabele normaal of niet-normaal verdeeld is. -
3. Achterliggende principes van de verklarende statistiek
J.W.R. TwiskSamenvattingIn dit hoofdstuk wordt allereerst het verschil tussen schatten en toetsen besproken en wordt uitgelegd dat een effectschatting met een 95 %-betrouwbaarheidsinterval meer informatie geeft dan het resultaat van een statistische toets. Verder komt aan de orde dat kansen en kansverdelingen een cruciale rol spelen bij zowel schatten als toetsen. Daarnaast wordt de t-verdeling geïntroduceerd als alternatief voor de standaardnormale verdeling en wordt de binomiale kansverdeling, die wordt gebruikt voor dichotome variabelen, uitgebreid besproken. -
4. De analyse van continue uitkomstvariabelen
J.W.R. TwiskSamenvattingWanneer een continue uitkomstvariabele vergeleken wordt tussen twee of meer groepen, kunnen de onafhankelijke t-toets en variantieanalyse worden gebruikt. Meestal wordt echter lineaire regressieanalyse gebruikt voor de analyse van een continue uitkomstvariabele. Het voordeel van lineaire regressieanalyse is dat de methode in alle situaties kan worden gebruikt, inclusief het analyseren van de relatie tussen een continue uitkomstvariabele en een continue onafhankelijke variabele. De lineaire regressielijn wordt gekenmerkt door twee parameters die altijd dezelfde interpretatie hebben. De b0 is de waarde van de uitkomstvariabele wanneer de onafhankelijke variabele 0 is en de b1 betekent dat wanneer de onafhankelijke variabele verschilt met één eenheid, de uitkomstvariabele verschilt met b1 eenheden. Verder wordt besproken hoe een niet-normaal verdeelde continue uitkomstvariabele geanalyseerd kan worden, hoe kan worden beoordeeld of de relatie tussen een continue uitkomstvariabele en een continue onafhankelijke variabele lineair is of niet en hoe met confounding en effectmodificatie kan worden omgegaan. -
5. De analyse van dichotome uitkomstvariabelen
J.W.R. TwiskSamenvattingWanneer een dichotome uitkomstvariabele vergeleken wordt tussen twee of meer groepen kunnen kruistabellen worden gebruikt. Op basis hiervan kunnen het risicoverschil, het relatief risico en de odds ratio worden berekend. Voor het statistisch toetsen kunnen de Fisher-exact toets en de chi-kwadraat toets worden gebruikt. Voor al deze situaties is ook logistische regressieanalyse beschikbaar. Logistische regressieanalyse is vergelijkbaar met lineaire regressieanalyse in die zin dat de regressiecoëfficiënten dezelfde interpretatie hebben, alleen is de uitkomst anders, namelijk de natuurlijke logaritme van de odds op het hebben van de dichotome uitkomstvariabele. Hierdoor kan de regressiecoëfficiënt voor een onafhankelijke variabele worden omgezet in een odds ratio. In dit hoofdstuk worden verder de controle van de lineariteit van de relatie met een continue onafhankelijke variabele en confounding en effectmodificatie besproken. De manier waarop dit gebeurt bij logistische regressieanalyse is precies hetzelfde als bij lineaire regressieanalyse. -
6. De analyse van overlevingsdata (survivaldata)
J.W.R. TwiskSamenvattingOverlevingsdata wordt gekenmerkt door een dichotome uitkomst (het event) en de tijd waarop het event plaatsvindt. Om overlevingsdata te beschrijven worden Kaplan-Meier overlevingscurves gebruikt, terwijl de log-rank toets kan worden gebruikt om overlevingscurves met elkaar te vergelijken. Cox regressieanalyse is geschikt om effectschattingen te krijgen en is vergelijkbaar met lineaire en logistische regressieanalyse, op een manier dat de regressiecoëfficiënten dezelfde interpretatie hebben. Alleen de uitkomst is anders, namelijk de natuurlijke logaritme van de hazardfunctie. Daarom kan de regressiecoëfficiënt van een onafhankelijke variabele worden omgezet in een hazard ratio, oftewel een relatief risico gemiddeld over de tijd. Omdat de effectschatting gemiddeld over de tijd is, is dit alleen een goede effectschatting als de hazards proportioneel zijn. In dit hoofdstuk worden verder de controle van de lineariteit van de relatie met een continue onafhankelijke variabele en confounding en effectmodificatie besproken. Bij Cox regressieanalyse gaat dit op precies dezelfde manier als bij lineaire en logistische regressieanalyse. -
7. Multiple regressieanalyse: associatiemodellen en predictiemodellen
J.W.R. TwiskSamenvattingBij multiple regressieanalyse worden meerdere onafhankelijke variabelen tegelijk geanalyseerd. Hierbij moet onderscheid worden gemaakt tussen associatiemodellen en predictiemodellen. Het doel van een associatiemodel is om de relatie tussen een uitkomstvariabele en één centrale onafhankelijke variabele zo goed mogelijk te schatten. Het doel van een predictiemodel daarentegen is om een bepaalde uitkomst zo goed mogelijk te voorspellen door een aantal onafhankelijke variabelen. Voor zowel het maken van een associatiemodel als een predictiemodel zijn verschillende procedures beschikbaar en het is belangrijk om te weten dat verschillende procedures tot verschillende resultaten kunnen leiden. Een groot deel van dit hoofdstuk gaat over kwaliteitsindicatoren voor predictiemodellen. Voor de kwaliteit van een predictiemodel wordt onderscheid gemaakt tussen interne kwaliteit (hoe goed het model past bij de data) en externe validiteit (hoe goed het model zich gedraagt in een externe dataset). In het laatste deel van het hoofdstuk wordt machine learning kort geïntroduceerd. -
8. Andere uitkomstvariabelen
J.W.R. TwiskSamenvattingIn de eerste hoofdstukken werd de analyse van continue uitkomstvariabelen, dichotome uitkomstvariabelen en overlevingsdata besproken. In dit hoofdstuk wordt de analyse van andere uitkomstvariabelen behandeld, zoals categoriale uitkomstvariabelen, count uitkomstvariabelen en gecorreleerde uitkomstvariabelen. Voor de analyse van categoriale uitkomstvariabelen kunnen kruistabellen worden gebruikt en als regressietechniek is multinomiale logistische regressieanalyse beschikbaar. Count uitkomstvariabelen kunnen worden geanalyseerd met Poisson regressieanalyse of negatieve binomiale regressieanalyse. Wat betreft de analyse van gecorreleerde uitkomstvariabelen, worden mixed model analyse en generalised estimating equations kort geïntroduceerd. Een van de belangrijkste conclusies van dit hoofdstuk is dat alle regressieanalyses in principe hetzelfde zijn voor wat betreft de interpretatie van de regressiecoëfficiënten, de correctie voor confounding, het onderzoek naar effectmodificatie en de controle van lineariteit van een relatie met een continue onafhankelijke variabele. -
9. Valkuilen in statistische analyses
J.W.R. TwiskSamenvattingIn dit hoofdstuk worden mogelijke valkuilen in statistische analyses besproken. Collineariteit treedt op wanneer twee onafhankelijke variabelen sterk met elkaar gecorreleerd zijn. Dit kan leiden tot grote standaardfouten en soms tot een zogenaamde sign switch. Mediatie analyse is een belangrijk instrument om causale mechanismen te onderzoeken. Binnen de mediatie analyse wordt onderscheid gemaakt tussen het totale effect, het directe effect en het indirecte effect. Het probleem met mediatie analyse is dat de analyse feitelijk hetzelfde is als de analyse van confounding. Het enige verschil is de interpretatie van de resultaten van de analyse. Tot slot wordt uitgebreid stilgestaan bij het probleem van missing data, waarin onderscheid gemaakt kan worden tussen missing completely at random (MCAR), missing at random (MAR) en missing not at random (MNAR). Er wordt uitgelegd hoe missing data kan worden onderzocht en wat het idee is achter multiple imputatie. -
10. Sample size berekeningen
J.W.R. TwiskSamenvattingVoordat een (para)medisch wetenschappelijk onderzoek wordt uitgevoerd, moet eerst worden bepaald uit hoeveel personen de onderzoekspopulatie moet bestaan. Dit gebeurt meestal door middel van een sample size berekening. In dit hoofdstuk wordt niet alleen de manier besproken waarop dit kan worden gedaan, maar wordt ook kritisch gekeken naar het werkelijke belang van zo’n berekening. -
11. Betrouwbaarheid van meetinstrumenten
J.W.R. TwiskSamenvattingIn het laatste hoofdstuk wordt de betrouwbaarheid van meetinstrumenten besproken. In dit kader wordt onderscheid gemaakt tussen reproduceerbaarheid en validiteit. Om de mate van betrouwbaarheid te schatten zijn verschillende methoden beschikbaar. Zo wordt voor dichotome variabelen meestal Kappa gebruikt, terwijl voor continue variabelen, de Bland-Altman plot en de intraklasse correlatiecoëfficiënt het meest gebruikt worden. -
Nawerk
- Titel
- Toegepaste (para)medische statistiek
- Auteur
-
J.W.R. Twisk
- Copyright
- 2026
- Uitgeverij
- BSL Media & Learning
- Elektronisch ISBN
- 978-90-368-3190-1
- Print ISBN
- 978-90-368-3189-5
- DOI
- https://doi.org/10.1007/978-90-368-3190-1