Wir brauchen Ihre Unterstützung — Jetzt Mitglied werden! Weitere Infos

(5) Wahrscheinlich, unwahrscheindlich, wahr

Wahrscheinlichkeiten verändern sich grundlegend je nach den Bedingungen, unter denen sie gemessen oder geschätzt werden. Dies ist der Grund für eine Vielzahl falscher Berechnungen, die Betroffene immer wieder zu Fehlreaktionen verleiten.

Angenommen, alle erwachsenen Mitteleuropäer müssten sich zwangsweise einem Aids-Test unterziehen. Was geschieht nun, wenn ein Test positiv ausfällt? Für viele wäre durch einen solchen Befund das soziale Umfeld und das Leben zerstört, im Gefolge von Panikreaktionen wären Selbstmorde nicht auszuschliessen. Tatsächlich aber litte die überwältigende Mehrheit der bei einer solchen Aktion positiv getesteten Personen gar nicht an Aids. Obwohl moderne Aids-Tests eine vorhandene Infektion mit allergrösster Wahrscheinlichkeit erkennen, wären die tatsächlich Kranken unter den als krank Diagnostizierten in der Minderheit.

Die Wahrscheinlichkeit, eine vorhandene Erkrankung korrekt zu diagnostizieren, heisst auch «Sensitivität» eines Tests. Sie liegt inzwischen bei guten Aids-Tests bei fast 99,9 Prozent. Mit anderen Worten, von 1000 an Aids Erkrankten werden 999 korrekt als infiziert erkannt. Auf diese Zahlen vertrauen unsere Mediziner; sie belegen – zumindest auf den ersten Blick – die Zuverlässigkeit der Diagnose. Ein Fehler kommt nur einmal in rund 1000 Fällen vor. Ergo denkt ein positiv Diagnostizierter: Ich habe mit 99,9 Prozent Wahrscheinlichkeit tatsächlich Aids.

In Wahrheit läge diese Wahrscheinlichkeit jedoch unter 10 Prozent. Was nämlich viele Patienten, aber auch viele Ärzte immer wieder gern vergessen, ist, dass es neben dem Übersehen einer tatsächlich vorhandenen Krankheit noch eine zweite Fehlerquelle gibt: ein nicht Infizierter wird zu Unrecht als erkrankt eingestuft (eine falsche positive Diagnose). Auch diese Fehler kommen, wenn auch selten, vor. Angenommen, die Quote falscher positiver Diagnosen liege bei einem Aids-Test bei rund 1 Prozent. Bei 100 Millionen getesteten erwachsenen Mitteleuropäern, davon 100’000 tatsächlich infiziert (diese Zahl entspricht den aktuellen Schätzungen), würden von diesen 100’000 infizierten 99’900 korrekt als infiziert erkannt. Das ist eine respektable Leistung. Aber auch von den 99,9 Millionen nicht infizierten würde fälschlicherweise 1 Prozent, und das sind immerhin 999’000 Menschen, als infiziert diagnostiziert. Zusammen ergäbe das 1’098’900 positive Tests, aber unter diesen positiv getesteten Personen hätten über 90 Prozent überhaupt kein Aids.

Nun sind Massenuntersuchungen auf Aids in Mitteleuropa nirgends ernsthaft vorgesehen, aber auf anderen Gebieten, etwa bei der Brustkrebsvorsorge für Frauen, wo solche Massenuntersuchungen aktiv betrieben werden, kommen falsche positive Diagnosen in grossem Umfang vor. Wenn man etwa dem Berliner Psychologen Gerd Gigerenzer glauben darf, der sich dieser Thematik in mehreren bekannten Büchern zugewandt hat, richten Reihenuntersuchungen auf Brustkrebs, sofern in grossem Umfang auch bei nicht besonders gefährdeten Frauen durchgeführt, wegen dieser falsch positiven Diagnosen mehr Schaden als Nutzen an. Was dabei besonders beunruhigt, ist, dass selbst Ärzte diesen Fehleinschätzungen tatsächlicher Gefahren erliegen. Gigerenzer und seine Kollegen haben einer repräsentativen Auswahl von 48 Ärzten folgende Lage zur Bewertung vorgelegt: ein Prozent aller getesteten Frauen haben Brustkrebs. Eine Mammographie entdeckt diesen Krebs mit einer Wahrscheinlichkeit von 80 Prozent und gibt in 10 Prozent aller Fälle einen Fehlalarm. Wieviel Prozent der positiv getesteten Frauen haben tatsächlich Brustkrebs?

Die korrekte Antwort lautet: rund acht Prozent. Die Antworten der Ärzte variierten von ein Prozent bis 90 Prozent. Nur vier von 48 Ärzten kamen auch nur in die Nähe der richtigen Antwort von acht Prozent. Wenn aber die Ärzte selbst nicht wissen, wie positive Tests zu lesen sind, was sollen erst ihre Patienten denken?

In der Sprache der Mathematik handelt es sich hier um Argumente mit sogenannten «bedingten Wahrscheinlichkeiten». Wenn ich Zusatzinformationen über ein Zufallsphänomen bekomme, berührt das unter Umständen die Wahrscheinlichkeit für bestimmte Ereignisse. Die Wahrscheinlichkeit für eine Sechs beim Würfeln ist 1/6 (es gibt 6 Möglichkeiten, alle gleich wahrscheinlich, also hat jede Zahl die Wahrscheinlichkeit 1/6). Wenn ich aber weiss, dass eine Zahl grösser als drei gefallen ist, steigt diese Wahrscheinlichkeit auf 1/3 (Es bleiben drei Zahlen übrig, 4, 5 und 6, alle sind gleich wahrscheinlich, ergo ist die Wahrscheinlichkeit für eine Sechs jetzt 1/3). In unserem Aids-Beispiel beträgt die Wahrscheinlichkeit einer Infektion für einen zufällig ausgewählten erwachsenen Mitteleuropäer 100’000 zu 100 Millionen, das ist 0,1 Prozent. Wenn ich aber weiss, dass der Betroffene positiv getestet wurde, steigt diese Wahrscheinlichkeit, aber nicht auf 99,9 Prozent sondern nur auf 9,09 Prozent (99’900 geteilt durch 1’098›900). Das ist zwar mehr als ohne positive Diagnose, aber weit weniger als viele fälschlich glauben.

Solche falsch berechneten bedingten Wahrscheinlichkeiten führen uns auch in anderen Zusammenhängen immer wieder in die Irre. Hier einige Beispiele von Schlagzeilen aus deutschsprachigen Tages- und Wochenzeitungen:

«Fussballer die grössten Bruchpiloten» (Der «Stern» zu einem Artikel über Sportunfälle).

«Von wegen Pitbull & Co.: Schäferhunde am bissigsten!» (Die «Dortmunder Ruhr-Nachrichten» zu einer Statistik, wonach 31 Prozent aller erfassten Angriffe von Hunden auf Menschen, mehr als durch jede andere Rasse, von Schäferhunden begangen werden).

«Inlineskaten vor allem für Kinder gefährlich» («Die Welt» über Unfälle beim Rollschuhfahren).

«Vorsicht vor deutschen Skitouristen» («Der Spiegel» über Sportverletzungen in Schweizer Wintersportgebieten).

Alle diese Aussagen betreffen bedingte Wahrscheinlichkeiten. Ich weiss, ein Mensch spielt Fussball. Also ist die Wahrscheinlichkeit für eine Sportverletzung grösser, als wenn er Hockey, Handball oder Tennis spielt. Mir begegnet ein Schäferhund. Also ist die Wahrscheinlichkeit, jetzt gebissen zu werden, grösser als bei einem Dackel oder Pitbull Terrier. Ein Kind läuft auf Inlineskatern durch die Gegend. Also ist die Wahrscheinlichkeit, dabei einen Schaden zu erleiden, grösser als bei einem Rentner. Ein deutscher Skifahrer gleitet über eine Schweizer Piste. Also ist die Wahrscheinlichkeit, dass er sich oder einem anderen dabei die Knochen bricht, grösser als bei einem Franzosen oder Spanier.

In Tat und Wahrheit sind vermutlich alle diese Thesen falsch. Warum gehen die meisten Hundebisse auf Schäferhunde zurück? Weil das die in Mitteleuropa populärste Hunderasse ist. Warum erleiden vor allem Kinder Unfälle beim Rollschuhfahren? Weil Rentner dieser Sportart eher wenig frönen. Warum verursachen vor allem deutsche Skifahrer Skiunfälle in einem bestimmten Urlaubsort der Schweiz? Weil es dort kaum Touristen aus Spanien oder Frankreich gibt.

In der Sprache der bedingten Wahrscheinlichkeiten werden hier das bedingte und das bedingende Ereignis verwechselt. Wenn ich weiss: Bei einem Hundebiss ist der Beisser mit höherer Wahrscheinlichkeit ein Schäferhund als ein Dackel, so folgt daraus keinesfalls, dass mich ein entgegenkommender Schäferhund nun eher beisst als ein Dackel. So werden doch auch über 80 Prozent aller Verkehrsunfälle von nicht alkoholisierten Autofahrern verursacht. Aber kein Mensch wird daraus folgern, dass Alkohol die Verkehrssicherheit erhöht. Oder formal: die Wahrscheinlichkeit für Alkohol, gegeben Unfall, mit der Wahrscheinlichkeit für Unfall, gegeben Alkohol, verwechseln.

Trotzdem kommen solche Verwechslungen immer wieder vor, mit zum Teil dramatischen Konsequenzen. Im nordrhein-westfälischen Wup-per-tal stand Anfang der siebziger Jahre des letzten Jahrhunderts ein Schornsteinfeger vor Gericht – er hätte die Frau eines Kollegen ermordet. Beweis: die Wahrscheinlichkeit, dass eine am Tatort gefundene Blutspur mit der des Schornsteinfegers rein aus Zufall übereinstimmte, betrug nach der durchaus korrekten Berechnung eines zu Hilfe gezogenen Sachverständigen nur 2,7 Prozent. Oder anders ausgedrückt: die Wahrscheinlichkeit für die vorgefundenen Indizien, gegeben Unschuld, betrug magere 2,7 Prozent (später aufgrund weiterer Indizien sogar weit weniger als 1 Prozent). Daraus zog der Sachverständige den Schluss, dass der Schornsteinfeger mit Wahrscheinlichkeit 97,3 Prozent der Mörder war. Mit anderen Worten: er verwechselte die Wahrschein-lichkeit für die vorgefundenen Daten, gegeben Unschuld, mit der Wahrscheinlichkeit für Unschuld, gegeben die vorgefundenen Daten und hätte den armen Schornsteinfeger damit beinahe ins Gefängnis gebracht. Nur ein perfektes, später beigebrachtes Alibi hat ihn davor gerettet.

Wenn die Kenntnis eines Sachverhaltes A die Wahrscheinlichkeit für einen anderen Sachverhalt B erhöht, so sagt man auch: A ist günstig für B. Oft wird das aus einer hohen bedingten Wahrscheinlichkeit für B, gegeben A, geschlossen. Das ist zuweilen wahr, zuweilen falsch. Ein bekanntes Beispiel für einen falschen Schluss ist die häufige Warnung vor der Gefahr des Ehelebens, etwa in einer Pressemitteilung des britischen Innenministeriums. Von 1’221 weiblichen englischen Mordopfern der Jahre 1984 bis 1988 wurden 44 Prozent von ihren Ehemännern oder Geliebten umgebracht, 18 Prozent von anderen Verwandten, weitere 18 Prozent von Freunden und Bekannten, nur 14 Prozent von unbekannten Fremden. Kann man daraus schliessen, dass die bedingte Wahrscheinlichkeit für Mord, gegeben eine Frau trifft einen Fremden, kleiner ist als die bedingte Wahrscheinlichkeit für Mord, gegeben eine Frau trifft ihren Mann? Oder anders ausgedrückt, dass Eheleben günstig ist für Mord?

Ganz offensichtlich nicht. Auch wenn niemand die Existenz von häuslicher Gewalt bestreitet, wird jemand allen Ernstes einer Frau oder auch einem Mann empfehlen, wie tatsächlich einmal in einer amerikanischen Zeitschrift geschehen, in New York lieber im Central Park als in der eigenen Wohnung zu übernachten?

Dazu eine weitere Quelle für den inkorrekten Schluss, dass ein Sachverhalt A einen anderen Sachverhalt B begünstige, und ein Paradebeispiel dafür, wie man mit bedingten Wahrscheinlichkeiten das Publikum mit Absicht in die Irre führt – dergleichen ist selten, kommt aber vor und heisst dann «Simpson’s Paradox». Zu dessen In-szenierung werden die Untersuchungsgegenstände in Gruppen aufgeteilt. In jeder dieser Gruppen ist A günstig für B, aber insgesamt ist A ungünstig für B!

Ein bekanntes Beispiel, wie durch das Ignorieren dieser Möglichkeit Politik gemacht wird, ist die moderne Debatte über die Zunahme der Krebsgefahr. Diese hat, wenn man der Mehrheit unserer Medien glauben darf, in fast allen Indu-strienationen in den letzten Jahren und Jahrzehnten zugenommen. Oder anders ausgedrückt: die zunehmende Industrialisierung begünstigt den Krebs. So will es das heilige und mit Zähnen und Klauen verteidigte Credo vieler moderner Umweltschützer.

In Wahrheit hat zumindest in Deutschland die Krebsgefahr in den letzen 20 bis 30 Jahren in fast allen Alterklassen abgenommen. Von 100’000 deutschen Frauen im Alter zwischen 20 und 24 Jahren starben im Jahr 1970 8 an Krebs, im Jahr 2001 nur 4. In der Altersklasse 25 bis 29 ist das Verhältnis 12:6, in der Altersklasse 30 bis 34 ist das Verhältnis 21:13, in der Altersklasse 35 bis 39 ist das Verhältnis 45:25 und so weiter bis ganz oben: in der Alterklasse 80 bis 84 starben im Jahr 1970 1644 von 100’00 Frauen an Krebs, im Jahr 2001 1’587. Durch das absichtliche Ausblenden dieser extrem wichtigen Zusatzvaria-blen Lebensalter lässt sich also die Zunahme der Krebsmortalität, die allein durch die steigende Lebenserwartung verursacht wird, als wirksames Propagandainstrument missbrauchen.

Ein letztes Beispiel für die absichtliche Irreführung mittels bedingter Wahrscheinlichkeiten gibt der O. J. Simpson-Prozess in den USA. Der bekannte Footballspieler wurde unter anderem auch deshalb, und mit grosser Wahrscheinlichkeit zu Unrecht, freigesprochen, weil es seinem Verteidiger gelang, das Gericht mit einer falschen bedingten Wahrscheinlichkeit zu täuschen. Und zwar war bekannt, dass O. J. Simpson seine später ermordete Frau des öfteren geschlagen hatte. Daraus versuchte die Anklage, Kapital zu schlagen, aber der Verteidiger konterte mit folgendem Argument: Nur einer von 2’500 Männern, die ihre Frau schlagen, bringt diese später um. Mit anderen Worten: die bedingte Wahrscheinlichkeit «Mann bringt Frau um», gegeben er hat sie vorher geschlagen, ist nur 1:2’500, und das ist alles andere als ein Indiz der Schuld.

Diese vernachlässigbare bedingte Wahrscheinlichkeit beeindruckte offenbar auch die Geschworenen, aber sie hatte einen Fehler: sie war in diesem Kontext völlig irrelevant. Von Interesse war die bedingte Wahrscheinlichkeit für «der Mörder ist der Ehemann», gegeben er hat seine Frau vorher geschlagen und die Frau ist ermordet worden. Diese Wahrscheinlichkeit beträgt über 80 Prozent und hätte vermutlich den einen oder anderen Geschworenen angeregt, etwas intensiver über eine mögliche Schuld des Angeklagten nachzudenken.

»
(0) Zahlenwahn

350 Jahre sind vergangen, seit ein sichtlich enttäuschter Engländer Bilanz zog aus seinem Studium der Klassiker: es seien die alten, moralphilosophischen Werke halt nicht «scripta scientifica», sondern bloss «scripta verbifica», Wortgeklingel und Gerede. Was Wunder, wenn es keine Fortschritte gebe im Bereich der Philosophie, wenn die Menschen immer noch Kriege führten und allerorten Elend herrsche. […]

Abonnieren Sie unsere
kostenlosen Newsletter!