
4.5 “Der” Test für DoE: Fishers Varianzanalyse 123
σ Standardabweichung der Messwerte (Schwankung um die Faktormittelwerte)
Tabelle 4.26 Keine Wahl: Die Standardabweichung als weiterer Eingangsparameter
Je größer die Standardabweichung (das Rauschen) ist, desto mehr Versuche wer-
den wir benötigen, um die statistische Signifikanz von praktisch signifikanten Un-
terschieden nachweisen zu können. Wie aber gelangen wir zu einer Abschätzung
von σ , der einzigen Größe, die wir nicht “frei” festlegen können?
Die einfachste Möglichkeit ist natürlich, dass schon Erfahrungswerte zur Mess-
streuung vorliegen, von denen man ausgehen kann. Ist dies nicht der Fall, kann
man im Rahmen einer Vorstudie eine Abschätzung für σ gewinnen oder versu-
chen, Expertenschätzungen einzuholen. Bleibt man unsicher, sollte man verschie-
dene Schätzwerte für σ ausprobieren und die jeweils benötigten Versuchszahlen
ansehen — möglicherweise zeigt sich, dass man ohnehin keine genauere Abschät-
zung braucht, da man in einer Situation ist, in der kleinere Veränderungen von σ
ohnehin keine Auswirkungen (mehr) haben.
Die mit diesen Parametern durchzuführenden Berechnungen sind relativ kom-
plex (genaueres findet man z.B. bei [119, S. 101ff.]), aber glücklicherweise bieten
manche Statistikprogramme Verfahren an, die uns das Leben erleichtern.
Ein Beispiel: Eine Fahrzeugtechnikerin möchte drei verschiedene neue Techno-
logien, die helfen sollen, den Normverbrauch eines Fahrzeugs zu reduzieren, mit ei-
nem nicht modifizierten Basisfahrzeug vergleichen. Aus der Erfahrung ist bekannt,
dass die Standardabweichung des dazu benutzten Prüfstandes in der Größenordnung
von 0.1l/100km liegt.
1. Da man nicht ohne Grund in neue, teure Technologien investieren möchte, soll
das α-Risiko auf 5% beschränkt sein — die Wahrscheinlichkeit, einen Effekt
einer Technologie festzustellen, der nicht existiert, soll maximal 5% betragen.
2. Existiert ein Effekt, so will man ihn mit 80% Sicherheit erkennen, wenn er eine
Verbesserung von...
3. ...mindestens 0.25l/100km bedeutet.
4. Sie misst auf vier verschiedenen Stufen und sucht einen Unterschied zwischen
zwei beliebigen Faktorstufen.
5. Die der Anzahl benötigter Versuche zugrunde liegende Standardabweichung
wird mit 0.1l/100km angenommen.
Mit diesen Parametern kann man mit Programmhilfe ermitteln, dass 5 Versuche
pro Stufe benötigt werden, denn damit erreicht man eine Power von 84.7%, wäh-
rend mit 4 Wiederholungen lediglich eine von 71% erreicht würde. Hält man auch
kleinere Verbesserungen für praktisch signifikant, erhöht sich die Anzahl benötig-
ter Versuche schnell, wenn man die Power von 80% beibehalten möchte, wie aus
Tabelle 4.27 ersichtlich wird.
Tabelle 4.27 enthält im übrigen zwei gute Nachrichten:
1. Die gezeigten Versuchsumfänge gelten je Faktorstufe. Hat man aber mehrere
Faktoren, so wird jede Stufe ohnehin schon mehrfach gemessen!