Ȇbersichtsseite

 

DIE ZEIT/Feuilleton, 43, 18.Oktober 1974, S.25-26

Titel: »Der große Streit um die Intelligenz (II) ‒ Was IQ-Tests messen: Eine unerklärte und undefinierte und dennoch faßbare und reale Größe«

© 1974 DIE ZEIT und Dieter E. Zimmer

 

 

Die IQ-Kontroverse, 1974

Von Dieter E. Zimmer

Begriffsklärung: Korrelation, Variabilität, Varianz, Standardabweichung

 

DIE GANZE IQ-KONTROVERSE versteht leider nicht, wer nicht wenigstens einen ungefähren Begriff hat, was eine 'Korrelation' ist und was Psychologie, Soziologie, Pädagogik und Verhaltensgenetik damit anfangen können.

          Eine Korrelation, so steht es im Wörterbuch, ist eine Wechselbeziehung. Das ist richtig, aber die Definition ist so nichtssagend, daß sie den Ausflug ins Vorfeld der statistischen Mathematik nicht erspart.

          Die Korrelationsrechnung vergleicht zwei unabhängig voneinander variierende Merkmale: Sie stellt damit die Variabilität beider Merkmale fest. Zum Beispiel: Lebensalter und Bauchumfang. Sie fragt, ob zwischen diesen beiden eine Beziehung zu entdecken ist, und wenn, wie diese sich in einer einzigen Zahl ausdrücken ließe. Sie sammelt also in einer bestimmten Gruppe von "Probanden", für die und nur die ihre Aussagen dann gelten, zwei Reihen von Meßwerten: eine für die Bauchweite, eine andere fürs Alter. Wenn in jedem Alter gleich häufig sämtliche Bauchweiten festgestellt werden sollten, folgt daraus, daß Alter und Leibesumfang nichts miteinander zu tun haben, daß sie unabhängig voneinander variieren, daß nichts als der Zufall bestimmt, ob einer in einem bestimmten Alter den Bauch hat, den er hat. Es besteht in diesem Fall also keinerlei Korrelation zwischen beiden Merkmalen. In unserer Zivilisation würde sich wahrscheinlich herausstellen, daß Ältere häufig dicker sind als Jüngere. In diesem Fall spricht man von einer positiven Korrelation. In einer anderen Kultur, die ihre Alten hungern läßt oder in der die Alten aus biologischen Gründen zur Ausmergelung neigen, korrelierten Alter und Leibesumfang ebenfalls, aber negativ: je älter, desto dünner.

          Den Grad der gemeinsamen Variation von zwei solchen Merkmalen drückt man in einer Zahl aus, dem Korrelationskoeffizienten. Null bedeutet: keine Korrelation, reiner Zufall. +1: perfekte positive Korrelation ‒ in genau dem gleichen Grad, in dem sich das eine Merkmal verändert, verändert sich auch das andere. -1: perfekte negative Korrelation. Die Wippe ist ein anschauliches Beispiel für einen Korrelationskoeffizienten von -1: In genau dem gleichen Maß, in dem sich das eine Ende von der Erde entfernt, nähert sich ihr das andere.

          Die meisten Korrelationen sind weniger offensichtliche und perfekte Zusammenhänge. Es sind Dezimalbrüche zwischen -1 und +1.

          Theoretisch wäre es möglich, alle möglichen Merkmale auf diese Weise zu vergleichen. Im Frühling ist es wärmer geworden; im Frühling sind auch die Preise gestiegen. Es ergäbe sich also mit Sicherheit eine Korrelation zwischen Lufttemperatur und Preisniveau, und zwar eine positive. Aber sie wäre absurd: Die Korrelationsrechnung hat nur Sinn, wenn beide Merkmale in einem nachweislichen Zusammenhang stehen, sei es, daß das eine von dem anderen (mit)verursacht ist, sei es, daß beide auf ein und dieselbe Ursache zurückgehen. Über die Art dieses Zusammenhangs sagt die Korrelation selbst rein gar nichts aus. Es ist ihr auch nicht anzusehen, ob Merkmal A von Merkmal B abhängig ist oder umgekehrt: ob die Frühlingstemperaturen die Preise nach oben getrieben oder die höheren Preise einem wärmeren Klima Vorschub geleistet haben. Wer Korrelationen sucht, muß damit rechnen, neben den sinnvollen auch absurde Scheinkorrelationen an den Tag zu fördern.

          Was aber nun heißt es, wenn zum Beispiel IQ und Schulleistung mit dem Koeffizienten 0,7 korrelieren? Ungefähr versteht man es sofort intuitiv: Es gibt da einen Zusammenhang, der irgendwo zwischen totaler Abhängigkeit der Schulleistung vom IQ und totaler Unabhängigkeit beider voneinander liegt, und zwar eher auf der höheren Seite. Aber genau?

          Dazu sind zwei weitere technische Begriffe nötig: 'Varianz' und 'Standardabweichung'.

          Man hat zum Beispiel eine Reihe von Testwerten auf dem Tisch: In einem IQ-Test hatte eine Gruppe von 5 Schülern Werte von 90, 95, 100, 105 und 110 Punkten erhalten, eine andere 75, 85, 95, 115 und 130. Wie man auf den ersten Blick sieht, sind die Ergebnisse der zweiten Gruppe breiter gestreut als die der ersten: Diese fünf Schüler sind verschiedener als die der anderen Gruppe, ihre Varianz ist größer. Die Varianz ist um so höher, je mehr Abweichungen vom Mittelwert es gibt und je höher diese ausfallen. Das läßt sich mit simpler Arithmetik fassen. Zunächst errechnet man die arithmetischen Mittelwerte. Sie liegen in beiden Gruppen genau bei 100 (a+b+c+d+e, geteilt durch 5). Dann berechnet man den Abstand der Einzelwerte zum Mittel, multipliziert jede dieser Differenzen mit sich selbst, addiert die so erhaltenen Werte und dividiert die Summe durch die Zahl der in die Rechnung eingegangenen Einzelfälle. So ergibt sich bei der ersten Gruppe eine Varianz von 50 (103+52+0+52+102 = 250 : 5), bei der zweiten von 400. Für viele Zwecke würde die Bezifferung der Varianz reichen. Aber es sind unhandlich große Zahlen. Um sie handlicher zu machen, ohne ihre Aussagekraft zu verwischen, zieht man aus ihnen die Quadratwurzel ‒ und erhält jene Größe, mit der auch in der ganzen IQ-Literatur ständig hantiert wird, die Standardabweichung. Sie gibt an, wie weit in einer Gruppe die Einzelwerte um den Mittelwert gestreut sind, und bildet somit die Meßzahl für die in einer Gruppe vorhandene Varianz. Bei der ersten Gruppe beträgt die Standardabweichung 7,07, bei der zweiten 20.

          Die Standardabweichung bietet einen rechnerischen Vorteil. Bei sämtlichen Normalverteilungen (egal wovon) umfassen die erste Standardabweichung über und die erste unter dem Mittelwert je 34 Prozent der Fälle; die zweite Standardabweichung weitere 13,5 Prozent; die dritte 2,3 Prozent. Die Standardabweichungen -3 bis +3 umspannen also 99,7 der Fälle. Bei der IQ-Verteilung sind die Tests so eingerichtet, dass jede Standardabweichung 15 IQ-Punkte umspannt. Woraus folgt: 68 Prozent der Bevölkerung, für die ein IQ-Test standardisiert wurde, haben einen IQ zwischen 85 und 115.

Der Korrelationskoeffizient ist also das Maß für den Grad, in dem zwei statistische Variablen miteinander variieren. Was ist damit anzufangen?

          Einmal kann man von der einen Merkmalskala in die andere hinüberrechnen, zum Beispiel von der Reihe "IQ" in die Reihe "Schulleistung". Beispiel: Einer hat einen IQ von 122,5. Das entspricht auf der IQ-Skala einer Standardabweichung von genau 1,5. Dieser Wert wird mit dem Korrelationskoeffizienten multipliziert, der den IQ mit der Schulleistung verbindet: mit 0,7 (je nach dem verwendeten Test sind etwas höhere und niedrigere Korrelationen ermittelt worden; 0,7 ist ein Durchschnittswert). Ergebnis: 1,05. Diese Zahl bedeutet: Bei einem Kind mit einem IQ von 122,5 ist die wahrscheinlichste Prognose für die Schulleistung die, daß es auf der Skala der Schulleistungen, mit welcher Zahlenskala die auch berechnet wird, bei einer Standardabweichung von 1,05 liegen wird und somit 83,8 Prozent der Kinder schlechter abschneiden werden. Der Wert kann, im Einzelfall, ganz woanders liegen ‒ aber je ferner von 1,05, um so weniger wahrscheinlich.

          Zweitens läßt sich aus dem Korrelationskoeffizienten ersehen, in welchem Maß ein Merkmal für das von ihm mutmaßlich abhängige verantwortlich gemacht werden kann. Dazu multipliziert man den Korrelationskoeffizienten mit sich selber und das Ergebnis mit 100. Dann hat man eine Prozentzahl. Daß IQ und Schulleistung mit 0,7 miteinander korrelieren, besagt also, daß die bei den Schulleistungen beobachteten Unterschiede zu 49 Prozent (0,7×0,7×100) auf Unterschiede im IQ zurückzuführen sind; die übrigen 51 Prozent der Unterschiede müssen andere Ursachen haben.

          Ein großer Teil der Arbeit eines Psychologen, Soziologen oder Verhaltensgenetikers, der Messungen auswertet, besteht darin, "Varianzen aufzuklären", also zu ermitteln, in welchem Grad ein gemessenes Merkmal sich auf ein anderes zurückführen läßt ‒ so überhaupt eine plausible Beziehung zwischen den beiden besteht. Sinnlose Korrelationen klären keine Varianzen auf. Intelligenz und Schulleistung sind keine unsinnige Korrelation.

 

»Literaturhinweise

Ȇbersichtsseite