Abstract
Zusammenfassung. Der Hamburg-Wechsler-Intelligenztest für Kinder in vierter Auflage (HAWIK-IV) ist eine in Anwendung und Auswertung recht aufwendige Testbatterie, so dass sich für viele Anwender die Frage nach Kurzformen stellt. Unter Verwendung des deutschen Normierungsdatensatzes (N = 1650) werden für alle 1022 möglichen non-trivialen Untertestkombinationen Schätzmodelle für den Gesamt-IQ ermittelt. Anschließend wird in verschiedenen Anwendungsszenarien (zum Beispiel Abbruch der regulären Untertestfolge versus Verkürzung a priori) ein Ausgleich von statistischer, testtheoretischer und testpraktischer Perspektive gesucht, um dem Anwender eine sinnvolle Auswahl an Verkürzungsoptionen in Form praktikabler Schätzgleichungen zur Verfügung zu stellen. Im dritten Schritt werden diese Modelle jeweils durch eine 10-fache Kreuzvalidierung bewertet. Für vierzehn ausgewählte Modelle werden vollständige Parametersätze dargestellt. Der Beitrag erörtert zudem das Für und Wider einer Testverkürzung als primär diagnostische und nicht allein statistische Problemstellung.
Abstract. The Wechsler Intelligence Scale for Children, fourth edition, (WISC-IV, German adaptation: HAWIK-IV) is an instrument of considerable scope and size, and practitioners have always raised the issue of short forms. This paper makes use of the German norming sample (N = 1650) for establishing regression models predicting full-scale IQ from all of 1022 possible nontrivial subtest combinations. Models are not evaluated against standard statistical criteria only but with reference to selected practitioner settings and scenarios (premature termination of regular test sequence versus planned break-off, maximum conservation of construct validity versus maximum predictive efficiency, etc.). Selected models are presented with full parameter sets, providing practitioners with viable instruments for optimal use of incomplete information. These models are submitted to 10-fold cross-validation. It is argued that generation and legitimation of short forms are not simply a statistical problem of precision but a substantial issue in diagnostics that needs to be understood in terms of validity.
Literatur
1989) A comparative study of ordinary cross-validation, v-fold cross-validation and the repeated learning-testing methods. Biometrika, 76, 503–514.
(2008). Differenzen im Intelligenzprofil bei Kindern mit Migrationshintergrund: Befunde zum HAWIK-IV. Kindheit und Entwicklung, 17, 76–89.
(2007). Intelligenzdiagnostik mit dem HAWIK-IV. Kindheit und Entwicklung, 16, 250–259.
(2004). Essentials of WISC-IV assessment. Hoboken, NJ: Wiley.
(2003). Update on continuous norming. Toronto: Paper presented at the annual meeting of the American Psychological Association.
(2002). Development of a prediction equation for insulin sensitivity from anthropometry and fasting insulin inprepubertal and early pubertal children. Diabetes Care, 25, 1203–1210.
(2007). Ausgewählte Verfahren der Holdout- und Kreuzvalidierung. In , Methodik der empirischen Forschung (2. u. erw. Aufl., S. 407–416). München: Gabler.
(2005). Prediction error estimation: a comparison of resampling methods. Bioinformatics, 21, 3301–3307.
(2006). Kurzgefasste Intelligenzdiagnostik bei Hirntumoren. Kindheit und Entwicklung, 15, 100–106.
(2006). Intelligenzdiagnostik. Kindheit und Entwicklung, 15, 71–75.
(2007). Hamburg Wechsler Intelligenztest für Kinder IV (WISC-IV). Bern: Huber.
. (1984). Crossvalidation of regression models. Journal of the American Statistical Association, 79, 575–583.
(2003). Continuous norming of tests and research scales: a twenty year update. Toronto: Symposium paper presented at the annual meeting of the Americal Psychological Association.
(2002). Welches sind die nach statistischen Kriterien besten Kurzformen des HAWIK-III? Zürich: Berichte aus dem Psychologischen Institut der Universität Zürich.
(1999). Hamburg-Wechsler Intelligenztest für Kinder (HAWIK-III). Bern: Huber.
. (1949). Wechsler Intelligence Scales for Children (WISC). New York: Psychological Corporation.
(2003a). WISC-IV. Technical and interpretive manual. San Antonio, TX: Psychological Corporation.
(2003b). WISC-IV. Administration and scoring manual. San Antonio, TX: Psychological Corporation.
(1995). Selecting the right-size model for prediction. Applied Intelligence, 6, 261–273
(2003). Resampling methods: concepts, applications, and justification. Practical Assessment, Research & Evaluation, 8 (19). Online verfügbar unter: PAREonline.net/getvn.asp?v=8&n=19 [03.07.2007]
(1985). Continuous norming: Implications for the WAIS-R. Journal of Clinical Psychology, 4 (1), 86–94.
(