4
Пространство w всех возможных значений
α
делится на критическую
−
α≤α<=
kk
0v
,
«спорную»
+−
α≤α<α=
kkc
v и допустимую
1v
kд
<α<α=
+
области. Спорной областью v
c
может быть один из интервалов для уровня значимости
α
k
в табл. 2. При попадании статистики
критерия
ˆ
в «спорную» область v
c
никакого решения относительно проверяемой гипотезы Н
0
не
принимается.
На наш взгляд, название области v
с
«спорной» неудачно, так как автор не указал субъектов
«спора». В нашем примере такие субъекты были указаны - это стороны А и В, а «спорные
области» определены иначе. Лучше, по-видимому, рассматривать зону v
с
как «область
неопределенности по Доерфелю».
Особенностью подхода Доерфеля является акцентирование внимания на нечеткости
(размытости) выбираемой исследователем границы между критической v
к
и допустимой v
д
областями.
К сожалению, теория проверки статистических гипотез не касается «рецептов» выбора
критического значения уровня значимости
α
k
. Это - задача экспертного оценивания, которую мы
рассмотрим позже
[
Р10
]
).
Из приведенных рассуждений следует, что в решении проблем проверки гипотез имеется
некоторая доля субъективизма ЛПР: «если нельзя, но очень хочется, то можно»
J
.
Пусть, например, ЛПР стороны А предпочтет некоторую гипотезу Н
1
, выберет некоторый
уровень значимости
α
k
и получит оценку
ˆ
, ненамного превышающую
α
k
. Возможно, «с меньшей
ответственностью», вновь выбрав другое значение
α
k
из табл. 2, большее, чем
ˆ
, ЛПР стороны А
все же примет «предпочтительную гипотезу» Н
1
.
Однако, другой стороне - В - часто не так важно мнение стороны А, как аргументация, на
которой основано это мнение (например, что найденного стороной А в исследовании уровня
значимости
ˆ
не достаточно для того, чтобы отклонить Н
0
, так как, по мнению ЛПР стороны В,
ˆ
>
α
k
). Важнейшим из аргументов здесь является оценка
ˆ
уровня значимости критерия.
Естественно, что автор работы (сторона А) в своём отчёте (или научной публикации) должен
представить материалы, позволяющие в случае необходимости стороне В перепроверить
корректность расчёта уровня значимости α
ˆ
, оценить мощность (или функцию мощности)
критерия и объем будущей выборки.»
Очевидно, что, делая вывод на основании статистических данных, сторона А должна
избегать категорических формулировок, так как опыт не «доказывает», а лишь «не противоречит»
принятым гипотезам. Действительно, значение
ˆ
1 характеризует вероятность, с которой не
отклоняют гипотезу Н
0
, если она верна, а значение β−
ˆ
1 - надежность принятой гипотезы Н
1
, если
она верна. Меры надежности «принять нулевую гипотезу Н
0
» - не существует! Поэтому об
отклоненной гипотезе Н
0
говорят, что она «отклонена с пренебрежимо малой вероятностью
ошибиться:
ˆ
< α
k
». Если гипотеза Н
0
не отклонена, то говорят, что «данные опытов ей не
противоречат на уровне значимости
ˆ
>
α
k
», или, иначе, что «найденный уровень значимости
ˆ
слишком велик, больше критического значения (
ˆ
> α
k
) и его не достаточно для того, чтобы
отклонить проверяемую гипотезу Н
0
». О «надёжности»
β−
1
принятой альтернативной гипотезы
Н
1
, также не говорят, но уже по другой причине: исследователи не оценивают мощность (или
функцию мощности) статистических критериев
β−
ˆ
1
то ли по неведению, то ли из-за сложности
вычислений. Отметим также, что многие неверно называют вероятность 1 -
ˆ
«надёжностью
нулевой гипотезы Н
0
»: чем эта вероятность больше, тем гипотеза Н
0
«надёжней», хотя на самом
деле всё наоборот!
Далее будут описаны три разных метода проверки гипотез: два метода, основанных на
расчете статистической оценки уровня значимости
ˆ
: традиционный
аналитический метод
,
основанный на предположении о нормальном законе распределения СВ, численный метод
Эфрона, который базируется на аппроксимации наблюдаемой в каждом эксперименте