Wir brauchen Ihre Unterstützung — Jetzt Mitglied werden! Weitere Infos
Was Intelligenztests messen – und was nicht
Jakob Pietschnig, zvg.

Was Intelligenztests messen – und was nicht

IQ-Tests können Intelligenz ziemlich genau messen. Doch der Mensch ist weit mehr als nur seine Testleistungen.

«Intelligenz ist das, was Intelligenztests messen.» Dieses Zitat stammt von Edwin Boring, einem frühen Anwender von Intelligenztests in den 1920er-Jahren. Diese Tautologie entsprang vermutlich der Frustration darüber, dass frühe Testentwicklungen – der erste formale Intelligenztest wurde erst 1909 in Frankreich von dem Arzt Alfred Binet entwickelt – oft nicht den prädiktiven Wert hatten, den man sich von ihnen erwartete.

Weniger zynisch gesprochen lässt sich sagen, dass Intelligenz eine allgemeine geistige Kapazität ist, welche die Fähigkeit umfasst, logisch schlusszufolgern, zu planen, komplexe Ideen zu verstehen oder aus Erfahrungen zu lernen. Das heutzutage am besten empirisch gestützte Intelligenzmodell wird als Cattell-Horn-Carroll-Modell bezeichnet und postuliert, dass es eine allgemeine Form der Intelligenz gebe (also etwas, das alle intelligenten Verhaltensweisen gemeinsam haben), die sich in viele spezifische Arten der Intelligenz (zum Beispiel logisches Schlussfolgern, Raumvorstellungsfähigkeiten oder Allgemeinwissen) aufteilen lassen.

Diese spezifischen Arten der Intelligenz hängen in der Gesamtbevölkerung alle positiv miteinander zusammen. Das bedeutet, dass gute Schlussfolgerer in der Regel auch gute Raumvorsteller und Allgemeinwisser sind und umgekehrt. Selbstverständlich gibt es auch Ausnahmen, wie zum Beispiel Menschen mit einer Inselbegabung. Darunter versteht man Personen, die im Allgemeinen unterdurchschnittliche kognitive Fähigkeiten besitzen, aber eine bestimmte Fähigkeit aussergewöhnlich gut beherrschen. Denken Sie zum Beispiel an den Film «Rain Man», in dem Dustin Hoffman einen Mann spielt, der zwar aussergewöhnliche Denkleistungen erbringt, aber an einfachsten Alltagshandlungen scheitert. Oder Personen mit Teilleistungsschwächen (zum Beispiel die Lese- und Rechtschreibschwäche); sie können die meisten Dinge sehr gut, weisen aber Defizite in einer spezifischen Fähigkeit auf. Das sind aber eben Ausnahmen, und die Beobachtung, dass in der Allgemeinbevölkerung sämtliche kognitiven Fähigkeiten positiv miteinander korreliert sind – die sogenannte positive Kupplung der Intelligenz –, zählt zu den am stabilsten replizierbaren Befunden der empirischen Forschung.

Mittels standardisierter psychometrischer Intelligenztests können je nach Konzeption einerseits spezifische Fähigkeiten, andererseits auch die allgemeine kognitive Fähigkeit valide erfasst werden. Ergebnisse von Intelligenztests sind nützlich für die Beantwortung verschiedener Fragestellungen und kommen dementsprechend in einer Vielzahl von Lebensbereichen zum Einsatz. Beispiele dafür finden sich in der Förder- und Entwicklungsdiagnostik im Schulbereich, in der berufsbezogenen Eignungsdiagnostik, der Forensik, bei militärischen Eignungsbeurteilungen und in vielen weiteren Bereichen.

Wichtig ist, dass es dabei eben um standardisierte und validierte Verfahren geht. Im Internet werden beispielsweise viele Dinge als Intelligenztests angepriesen, die den Ansprüchen an solche Verfahren nicht genügen. Hinter seriösen Intelligenztests stehen zumeist Jahrzehnte an Entwicklungsarbeit und die Vorgabe von solchen Instrumenten ist durch gesetzliche Berufsbestimmungen in den meisten Ländern streng reglementiert. Intelligenztests dürfen in diesem Sinne nur von dafür ausgebildeten Personen erworben und vorgegeben werden.

Tests werden normiert

Um Intelligenz messbar zu machen, braucht es einen Massstab, an dem man sich orientieren kann. Die Physik verwendet beispielsweise als Referenz für die Bestimmung der Länge eines Meters die Lichtgeschwindigkeit und hält fest, dass ein Meter der Strecke entspricht, die Licht in einem Vakuum während 1/299792458 Sekunden zurücklegt. Unpraktischerweise gibt es keine Naturkonstante, an die man sich im Falle der Intelligenz als Referenz anlehnen kann. Deshalb verwendet man repräsentative Stichproben von streng definierten Populationen als Massstab. Das ist möglich, weil das Merkmal Intelligenz in der Bevölkerung einer Glockenkurve folgt – der sogenannten Normalverteilung.

Um die Intelligenztestergebnisse von Personen sinnvoll einordnen zu können, muss jeder Test zunächst normiert werden. Es gibt viele verschiedene Masseinheiten, mit denen sich das machen lässt; die allgemein bekannteste dieser Einheiten ist der IQ. Um IQ-Massstäbe zu erstellen, wird beim Normierungsprozess die durchschnittliche Testleistung der Normierungsstichprobe mit 100 festgelegt, die durchschnittliche Abweichung mit 15. Damit erzielen etwa 68 Prozent der Bevölkerung einen IQ-Wert zwischen 85 und 115. Wenn Sie also drei Menschen auf der Strasse begegnen, können Sie davon ausgehen, dass zwei davon einen IQ zwischen diesen zwei Werten aufweisen. Bei Werten unterhalb von 70 spricht man von intellektueller Beeinträchtigung, bei Werten über 130 von Hochbegabung – nur je etwa 2 Prozent der Bevölkerung liegen in diesen Bereichen. Weil sich die Testleistung der Bevölkerung über Generationen hinweg ändert – über weite Teile des 20. Jahrhunderts wurde die Weltbevölkerung schlauer –, müssen wir diese Testnormierungen in regelmässigen Abständen wiederholen.1

Die Einsatzbereiche von Intelligenztests entsprechen der jeweiligen Population, für die sie entwickelt und auf die sie normiert wurden. Man kann also Intelligenztests nicht beliebig in verschiedenen Ländern einsetzen, ohne zunächst die Äquivalenz der verwendeten Testinhalte in diesen Ländern formal geprüft zu haben oder den Test zumindest anhand der neuen Population normiert zu haben.

Grob gesagt gilt: Je sprachlastiger ein Test ist, desto anfälliger ist er für Nonäquivalenz. Die Frage nach der Hauptstadt der Schweiz wird beispielsweise eine Schweizer Stichprobe einfacher beantworten können als eine kanadische; bei der Hauptstadt von Kanada wird es umgekehrt sein. Aber selbst Ergebnisse sprachfreier Tests sind nicht notwendigerweise automatisch zwischen verschiedenen Ländern vergleichbar. Moderne statistische Methoden der Testkonstruktion und -evaluation machen es allerdings möglich, zu prüfen, ob beobachtete Testleistungen zwischen Gruppen auf tatsächliche Fähigkeitsunterschiede oder Unterschiede in den Eigenschaften des Tests zurückzuführen sind.

Kein Anspruch auf Ganzheitlichkeit

Abschliessend möchte ich zwei Dinge betonen, die für die Bedeutung von Intelligenztests grundlegend sind und die meiner Erfahrung nach oft missinterpretiert werden. Erstens sagt das Ergebnis eines Intelligenztests nichts über den Wert einer Person aus. Diesen eigentlich auf der Hand liegenden Punkt betone ich hier, weil mir zumindest implizite Befürchtungen darüber immer wieder in Gesprächen mit Testpersonen begegnen. Zweitens ist zu betonen, dass man Menschen selbstverständlich nicht lediglich durch ihre Intelligenztestleistungen beschreiben kann. Es gibt wesentlich mehr Charakteristika abseits der Intelligenz, die einen Menschen ausmachen. Intelligenztests erheben allerdings auch nicht den Anspruch, eine ganzheitliche Beschreibung eines Menschen zu liefern.

«Es gibt wesentlich mehr Charakteristika abseits der Intelligenz, die einen Menschen ausmachen.»

Nichtsdestoweniger hat sich Intelligenz bislang konsistent als bester Prädiktor von positiven Lebensentwicklungen wie selbstberichteter Lebenszufriedenheit, Einkommen oder sogar Gesundheit gezeigt. Das bedeutet natürlich nicht, dass jede intelligente Person notwendigerweise glücklich, reich oder kerngesund sein muss, aber im Allgemeinen scheint Intelligenz uns Menschen dabei zu unterstützen, erfolgreich zu sein. Deswegen ist es wichtig, Intelligenz zu erfassen. Und das tun seriös konzipierte und von Fachleuten interpretierte standardisierte Intelligenztests sehr gut.

  1. Jakob Pietschnig: Intelligenz: Wie klug sind wir wirklich? Ecowin, 2021.

»
Abonnieren Sie unsere
kostenlosen Newsletter!