Die Packungsbeilage, bitte!

Politische Umfragen stossen in der Öffentlichkeit auf ebenso grosses Interesse wie Skepsis. Dabei ist das Problem weniger die Arbeit der Demoskopen als ihre Intransparenz.

 

In den aktuellen Umfragen zu den Präsidentschaftswahlen in den USA verfügt Joe Biden über einen komfortablen Vorsprung. Seit dem Ausbruch der Coronaviruspandemie in den USA hat der demokratische Herausforderer den Abstand auf den republikanischen Amtsinhaber Donald Trump ausgebaut. Doch der Blick auf die Vergangenheit stimmt misstrauisch: Vor vier Jahren führte Hillary Clinton die Umfragen ebenfalls an, bevor sie sich am Wahltag Trump geschlagen geben musste. Aufgrund dieser all­gegenwärtigen Erfahrung schwingt gegenüber ihrer Prognose­fähigkeit eine gehörige Portion Skepsis mit.

Der Mythos hält sich hartnäckig, der Wahlerfolg von Donald Trump 2016 sei ein demoskopisches Fiasko gewesen. Dabei wich das landesweite Ergebnis nur geringfügig vom Mittel der Umfragen ab. Im Durchschnitt wiesen diese einen Vorsprung Clintons von 3,3 Prozent aus, am Wahltag resultierte ein solcher von 2,1 Prozent. Damit war die Abweichung geringer als beispielsweise vier Jahre zuvor beim Sieg Barack Obamas über Mitt Romney.

Auch ausserhalb der USA gibt es stichhaltige Anhaltspunkte, dass die Verlässlichkeit von Wahlumfragen im Zeitverlauf nicht abgenommen hat. Die meines Wissens umfassendste empirische Analyse von mehr als 350 Wahlen in 45 Demokratien hat ergeben, dass keine Anzeichen dafür vorliegen, dass die Prognosefehler gestiegen sind. Umfragen scheinen somit besser als ihr Ruf zu sein.

Das vergessene Konfidenzintervall

Allerdings können Umfrageergebnisse leicht falsch interpretiert werden. Abgesehen davon, dass dem Wahlsystem Rechnung ­getragen werden muss – im Fall der amerikanischen Präsidentschaftswahlen sind die Elektorenstimmen massgebend, die auf Ebene der Bundesstaaten vergeben werden –, beschränkt sich die Medienaufmerksamkeit meist auf den Mittelwert von Umfragen. Dadurch wird mit dem sogenannten Konfidenzintervall eine zen­trale Information ausser Acht gelassen.

Das Prinzip von Wahlumfragen besteht darin, anhand von repräsentativen Stichproben Schlüsse über die Gesamtheit der wahlberechtigten Bevölkerung zu ziehen. Das Konfidenzintervall beruht auf dem Stichprobenfehler und gibt den Bereich an, in dem sich der in einer Umfrage ermittelte Mittelwert in der Wählerschaft höchstwahrscheinlich befindet. Es hat sich eingebürgert, dass jener Wertebereich angegeben wird, der bei einer fünf­prozentigen Fehlerwahrscheinlichkeit zu erwarten ist.

«Wenn die eigenen Zahlen deutlich vom Gros

der anderen Umfragen abweichen, ist die Versuchung gross,

sie so zu gewichten, dass sie besser ins allgemeine Bild passen.

Wenn das allerdings alle machen, entsteht eine systematische Verzerrung

zugunsten des allgemein erwarteten Resultats.»

Nehmen wir an, dass vor den nächsten Nationalratswahlen eine Umfrage für die FDP einen Wähleranteil von 16 Prozent ergibt. Gegenüber den Wahlen von 2019 entspricht dies einem Plus von einem Prozentpunkt. Manche Journalisten berichten von einem Aufschwung der Freisinnigen und sehen sie bereits als Wahlsieger. Solche Aussagen sind aber nicht zulässig, wenn sich das Wahlergebnis von 2019 (15 Prozent) innerhalb des Konfidenzintervalls der Umfrage befindet. Dieses liegt bei einer Stichprobe von 1000 Befragten typischerweise zwischen 14 und 18 Prozent.

Die Macht der sozialen Erwünschtheit

Auch bei Volksabstimmungen geraten Umfragen von Zeit zu Zeit in Verruf. So sorgte in der Schweiz 2009 die unerwartete Annahme der Minarettinitiative für grosses Aufsehen. Die letzte Umfrage vor der Abstimmung hatte eine Zustimmung von 37 Prozent (und eine Ablehnung von 53 Prozent) ergeben, am 29. November wurde die Volksinitiative mit mehr als 57 Prozent an den Urnen deutlich angenommen. Diese Diskrepanz, die der damalige Bundesrat Moritz Leuenberger im Nationalrat als «staatspolitisch gravierend» bezeichnete, löste nicht nur einen regelrechten Mediensturm aus, sondern wurde auch in verschiedenen wissenschaftlichen Gutachten aufgearbeitet.

Da es sich im Fall der Minarettinitiative um einen tabuisierten Themenbereich handelte, erscheint die soziale Erwünschtheit am plausibelsten als Erklärung für die markante Abweichung zwischen Umfrage- und Abstimmungsergebnis. Zahlreiche Umfrageteilnehmende neigten vermutlich dazu, an Stelle ihrer tatsächlichen Präferenz eine Antwort zu geben, die mit gesellschaftlichen Erwartungen und Normen übereinstimmte. Um gegenüber den interviewenden Personen nicht als islamfeindlich zu erscheinen, gaben viele Befürwortende wohl nicht zu, dass sie ein Ja einlegen würden.…

«MONAT für MONAT
eine sinnvolle Investition.»
Heinz Zimmermann, Professor für Finanzmarktökonomie,
über den «Schweizer Monat»