Stichprobenfehler

Könnte man sich, nachdem unsere ◊Ähndschi in den Umfrageergebnissen wieder auf eine Marke deutlich oberhalb von 50 % gehievt wurde, nicht einfach beruhigt umdrehen und selig weiterschlafen? In der Tat, das könnte man, wenn es nicht diese seltsame Formulierung gäbe: „Der Fehlerbereich liegt je nach Anteilswert bei 1,4 bis 3,1 Prozentpunkten” (Quelle: SpOn). Nicht zu vergessen: Die Stichprobe umfaßt 1005 Meinungen aus einer Gesamtheit von (geschätzt) 50 000 000. 😯
Stichprobe_BesterPolitiker1Ohne jetzt gewaltig am Rad von Her­leitung oder Formelei drehen zu wollen: es ist unwahrscheinlich, daß die ver­sprochenen Irrtumswahr­schein­lich­keiten tatsächlich so winzig sind.
Beispiel: In der Grundgesamtheit hat jeder eine Stimme. Sie kann lauten: „◊Mutti ist die Beste”. Man kann ‚pro‘ votieren (rot in der Abb.) oder ‚kontra‘. Eine Stichprobe wird gezogen, indem von einer festgelegten Personenanzahl das Votum erfragt und die Auswertung der Stichprobe als repräsentativ ange­nommen wird. Statt einer Stichprobengröße von 1005 Meinungen, die für 50 Mio. reprä­sentativ sein sollen, ist im vorliegenden Beispiel mit 16 Meinungen gerechnet worden, die für eine Grundgesamtheit von 800 000 stehen. Der Grund ist einfach: wenn man keine Formeln verwenden möchte, leistet ein Binomialbaum gute Dienste, um die Wahrschein­lichkeiten zu „ordnen”; und dieser ist für 16 Einzelereignisse noch gut überschaubar.
Stichprobe_BesterPolitiker2Es ist möglich, daß alle 16 zufällig gezogenen Meinungen ‚pro Merkel‘ ausfallen oder daß ausnahmslos alle gegen sie ausfallen. Wahrscheinlicher sind aber Werte, die in der Nähe des Resultates liegen, das die Grund­gesamtheit auszeichnet. Die nebenstehende Abbildung zeigt für die insgesamt 17 verschie­denen Auszählungs­ergebnisse der Stichprobe die jeweilige Auftrittswahrscheinlichkeit. Hervorgehoben sind die Stichprobe 1 aus der obigen Abbildung (4×pro, 12×kontra) und das Beispiel 2 (10×pro, 6×kontra).
Es ist auch die Streuung eingetragen: mit einer Wahrscheinlichkeit von ca. 16% wird eine Stichprobe einen deutlich zu geringen Sympathiewert ermitteln (hier: <41,5%), mit der gleichen Wahrscheinlichkeit wird eine Stichprobe einen deutlich zu hohen Wert ermitteln (hier: >66,5%). Die Streuung beträgt etwa 12,5 %, d.h. in 2 von 3 Fällen wird die Stichprobe einen Sympathiewert zwischen 41,5 und 66,5 % ergeben, obwohl er laut Voraussetzung exakt 54 % beträgt. Die Spanne lautet also keineswegs 51…57 % oder gar nur 53…55 %, wie im oben genannten Link vollmundig verkündet wird.
Ergo: Traue nur den Statistiken, die du selbst gefälscht hast…

Nachtrag (03.03.2016, 7:30 Uhr):
Und das (siehe oben) passiert, wenn man keine Ahnung hat oder zumindest partout auf Formeln verzichten zu können glaubt. 😦
Die „Argumentation”, daß ein Stichprobenumfang von 1005 gegenüber einer Gesamtheit von 50Mio. bei binären Werten zu gering ist, um repräsentativ zu sein, ist falsch (eher schon: Blödsinn). Ich bitte für die Verbreitung dieses Schwachsinns um Vergebung.
Stichprobe_BesterPolitiker3Die Formel ermöglicht die Berechnung der Wahrscheinlichkeiten dafür, daß in einer Stichprobe des Umfangs S eine konkrete Eigenschaft (hier: „Mutti ist die Beste”) k-mal gefunden wird und bei S-k ausgezählten Stimmen eben nicht (0 ≤ k ≤ S). N ist der Umfang der Grundgesamtheit, aus der eine Stichprobe gezogen wird; p ist eine Verhältniszahl, die für die Grundgesamtheit die Häufigkeit der zu schätzenden Eigenschaft beschreibt.
Anhand der Realisierungswahrscheinlichkeiten verschiedener Stichproben-Muster ist zu erkennen, daß die Schätzfehler um Größenordnungen stärker von S als von dem Verhältnis S/N abhängen. Für S = 1000 gilt für die Standardabweichung: σ ≤ 1,57 %; der eingangs zitierte Satz ist also keineswegs fehlerhaft. Er ist goldrichtig! Und er hat zumindest eine fruchtbringende Auseinandersetzung mit dem Themenkreis angeschubst… ^_^

Advertisements

Über ausgesucht

…desillusioniert
Dieser Beitrag wurde unter konkret, Kritik, Statistik, Zweifel abgelegt und mit , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

8 Antworten zu Stichprobenfehler

  1. lawgunsandfreedom schreibt:

    Da gab’s auf sciencefiles.org ein paar Beiträge in denen belegt wurde, daß „repräsentativ“ alles andere als repräsentativ sondern fehlerhaft ist und dieses Umfragesystem mit grade mal 1000 Samples abgelehnt wurde.

    http://sciencefiles.org/2016/02/11/bundestagswahlen-sind-nicht-repraesentativ/

    • ausgesucht schreibt:

      Hmm, da „fehlt” die Zielfunktion, m.a.W.: Was soll repräsentiert werden? Die Verteilung der Schuhgrößen, der Blutgruppen, des Brustumfangs, der Zahl der Haustiere, die Zahl der durchschnittlich im Monat auf Kisuaheli gelesenen (oder geschriebenen) Seiten etc. pp oder die Stimmabgabe pro zur Wahl zugelassenen Parteien? ^_^

ein Kommentar ist hier möglich:

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s