
98 4 Statistische Modellbildung
Man kann deshalb für jeden Versuchsumfang n feststellen, wie groß die Wahr-
scheinlichkeit ist, in 70% (oder mehr) aller Würfe zu gewinnen, wenn man von der
Gültigkeit der Hypothese p = 0.5 ausgeht.
Die Betrachtung der Histogramme in Abbildung 4.4 bestätigt unsere “qualitati-
ve” Vermutung, dass der erste Versuch (n=10) noch keinen Anlass bietet, mit dem
Kollegen zu streiten (da er mit einer fairen Münze immerhin eine Chance von 17.2%
hatte, 7 oder mehr Köpfe in 10 Versuchen zu werfen), während das Ergebnis des
dritten Versuchs (n=100) ein unzweifelhaftes Indiz dafür liefert, dass man betrogen
wurde, da die Chance für 70 oder mehr Köpfe bei einer fairen Münze fast Null ist.
ACHTUNG — TRUGSCHLUSSGEFAHR!
An dieser Stelle sei die Warnung vor einem typischen Trugschluss noch einmal wie-
derholt, der lautet, dass die Hypothese (einer fairen Münze) im ersten Fall bewiesen,
im zweiten widerlegt wurde. Dies ist falsch — nur der zweite Halbsatz gilt! Da es
nur eine verschwindend geringe Wahrscheinlichkeit von 0.003% gibt, mit einer fairen
Münze in 100 Versuchen 70 oder mehr Köpfe zu werfen, kann hier der logisch kor-
rekte Schluss gezogen werden, dass die Münze unfair ist — das Risiko, hierbei falsch
zu liegen, lässt sich mit eben diesen p = 0.003% genau quantifizieren, dem Wert des
α−Risikos. Hingegen ist im ersten Fall die Hypothese nicht widerlegbar — daraus
folgt jedoch keinesfalls ihr Beweis. Man kann nicht logisch zwingend folgern, dass
die Münze fair ist, nur weil sie ein mit Fairness vereinbares Ergebnis gezeigt hat!
“Every experiment may be said to exist only in order to give the facts a chance of dis-
proving the null hypothesis”... — man könnte sagen, dass Experimente nur existieren,
um den Fakten eine Chance zu geben, die Nullhypothese zu verwerfen. ([56, S. 18])
Die oben angestellten Betrachtungen zeigen im übrigen auch, dass man be-
reits im Vorfeld, also beispielsweise vor der Durchführung der 10, 50 oder 100
Münzwurfversuche, Akzeptanzschwellen für die Ablehnung der Hypothese berech-
nen kann, wenn man das α−Risiko vorgibt. So ergibt sich für α = 10% ein Ableh-
nungsbereich von
• 8 oder mehr Köpfen im Falle von 10 Versuchen (da diese bei einer fairen Münze
nur mit einer Wahrscheinlichkeit von ca. 5.5% eintreten)
• 31 oder mehr Köpfen bei 50 Versuchen (Eintrittswahrscheinlichkeit 5.9% )
• 57 oder mehr Köpfen bei 100 Versuchen (Eintrittswahrscheinlichkeit 9.7% )
Reduziert man das α−Risiko, etwa auf α = 1% (da einem der Kollege lieb und
teuer ist und man keinen unnötigen Streit riskieren möchte), so ergibt sich für
• 10 Versuche, dass man die Hypothese nicht schon ab 8 Köpfen ablehnen kann,
sondern erst ab 9 geworfenen Köpfen,
• 50 Versuche, dass man die Hypothese nicht schon ab 31 Köpfen ablehnen kann,
sondern erst ab 34 geworfenen Köpfen, und bei
• 100 Versuche, dass man die Hypothese nicht schon ab 57 Köpfen ablehnen kann,
sondern erst ab 62 geworfenen Köpfen.
Die mangelnde Konfliktbereitschaft hat ihren Preis — das Risiko, die Zeche
selbst zu bezahlen steigt...