1
6.2.2. Оценка дисперсии воспроизводимости отклика в пассивном регрессионном
эксперименте и проверка гипотезы об адекватности регрессионной модели
Если воспроизвести эксперимент сложно, проведите его единожды. (Вредный совет)
В одноимённой работе [Цейтлин Н. А., Гордеев Д. С., Ицков Ф. Э., Рудай А. Н. - Теор.
основы хим. технологии, т. 21, №6, с. 830-835, 1987] предложена методика вычисления
смещённая (но вполне пригодной для практических нужд) оценки дисперсии ошибки
воспроизводимости отклика по данным пассивного регрессионного эксперимента. Эта оценка
позволяет приблизиться к решению задачи проверки гипотезы о не адекватности результатам
наблюдений эмпирической функции регрессии (ЭФР), построенной по данным пассивного
регрессионного эксперимента. Такая задача долгое время являлась камнем преткновения
статистической практики: любой исследователь, даже мало сведущий в тонкостях
регрессионного анализа, мог обоснованно усомниться в адекватности полученной регрессионной
модели.
Начнём с замечаний о некоторых терминах в регрессионном анализе. Одни авторы называют
остаточную дисперсию
2
ост
σ
«дисперсией адекватности» [1], другие – «дисперсией
неадекватности» [2], третьи, всё-таки по существу – «остаточной дисперсией» [9]. Мы
остановимся на этом термине. Величину дисперсии
2
в
σ
ошибки воспроизводимости отклика Y
одни авторы называют «ошибкой опыта» [1], другие – «ошибкой отклика» [2], третьи – «ошибкой
воспроизводимости случайной величины Y» [3]. Мы будем использовать более точный термин:
2
в
σ
- дисперсия ошибки воспроизводимости отклика, или кратко – дисперсия
воспроизводимости отклика (ДВО).
Одним из наиболее распространенных методов проверки адекватности ЭФР
экспериментальным данным [3, 4] является сравнение остаточной дисперсии
2
ост
σ с ДВО
2
в
σ
.
Проверяемая гипотеза имеет вид
2
в
2
ост0
: σσ =H ; (1)
альтернативная:
2
в
2
ост1
: σσ >H
(см. гипотезу № 17 [Т3Р1]). Если гипотеза (1) не отклоняется,
вычисляют средневзвешенную оценку дисперсии отклика [5; Ф(4)Р3.10], которую используют
затем для определения ряда статистических характеристик регрессионной модели.
Оценку
2
в
S дисперсии
2
в
σ принято получать с помощью параллельных опытов [1]. Однако в
пассивном эксперименте (например, при исследовании производственного процесса) возможность
проведения параллельных опытов, как правило, отсутствует. Поэтому в качестве оценки ДВО
принимают остаточную дисперсию ЭФР [2]. Очевидно, что такой подход корректен только в
случае, если структура ЭФР выбрана верно (например, из теоретических соображений). Таким
образом, не зная ДВО, нельзя проверить гипотезу (1) об адекватности ЭФР, не зная верной ЭФР,
нельзя оценить ДВО в пассивном эксперименте.
Чтобы разорвать этот «замкнутый круг», предлагается итерационная процедура построения
ЭФР с оцениванием ДВО. На первом этапе обычным пошаговым методом регрессионного анализа
[3] строится ЭФР
ˆ
= f(b,x), (2)
где
ˆ
- оценка отклика; b - оценка вектора
β
параметров ЭФР; х - n-мерный вектор факторов.
Вычисляется также оценка
2
ост
S остаточной дисперсии. Далее с помощью изложенной ниже
процедуры вычисляется оценка сверху
2
1
S
для ДВО. Сравнение оценок
2
ост
S
и
2
1
S
позволит
принять решение о неадекватности ЭФР либо об отсутствии оснований на данном этапе для
отклонения гипотезы об адекватности ЭФР.
Если первая ЭФР неадекватна, следует поменять структуру базисных функций и перейти ко
второму этапу - построить новую ЭФР и заново оценить ДВО. Процедуру следует продолжать,
пока не будет найдена структура ЭФР, обеспечивающая адекватную аппроксимацию данных.
Рассмотрим метод оценивания ДВО. Назовем опыты в точках х
i
и х
j
почти параллельными,
если выполняется условие