
6.2.6. Разработка рациональных процедур программы
линейного регрессионного анализа.
Иррациональность Бога в том, что он не три-един, как все думают, а пи-един! (Из интернета)
В давние времена, когда президент Рейган был еще простым «народным артистом» США,
нами (в соавторстве) был произведен на свет программный продукт под названием РЕГАН
(РЕГрессионный АНализ) [16.41, 16.52]. По нашему мнению, это была самая лучшая (для нас) из
известных (нам) программ! Почему? Мы воспользовались лучшей (в то время) программой
регрессионного анализа (а нынче это могут быть, например, - ППП STATISTICA [10.15, 10.16,
http://www.statsoft.ru], SPSS [10.19, http://www.SPSS-buch.de], SAS [www.sas.com] и др.) и дополнили
её сервисными процедурами пользователя, которые разработали сами. Программа РЕГАН (и ей
подобные) совершенствуется АСом самостоятельно. В нашей версии [16.52] в программе РЕГАН
комплексно и всего за один подход к ЭВМ «интегративно» [1.27.] решались многие часто
встречаемые задачи регрессионного анализа.
В настоящее время пользователю статистических программ не составит большого труда
дополнить стандартные процедуры пакета программ по регрессионному анализу
дополнительными рациональными процедурами, некоторые из которых описаны, например, в
одноименной статье (Рудай А. Н., Цейтлин Н. А., Рудай В. И., Ицков Ф. Э. - В кн.: Технология и
автоматизация содового и смежных производств: Труды, т. 61/НИОХИМ. Харьков, 1985, с.72 -
84).
Практика построения математических моделей химико-технологических систем вообще и в
содовой промышленности [1-9], в частности, свидетельствует о том, что наиболее мощным
методом статистической обработки данных является
регрессионный анализ (РА)
. Программы РА
непрерывно рационализируются [10-17] в зависимости от особенностей решаемых задач в
предметной области, достижений статистической теории и интересов авторов программ.
Для обработки данных методом РА авторы использовали вначале стандартные процедуры
МО ЭВМ по статистике [12]. Однако, при решении каждой задачи возникали трудности, для
преодоления которых приходилось разрабатывать новые рациональные процедуры. Собранные
воедино (с помощью головной программы), эти процедуры составили пакет программ РА
(названный «РЕГАН»).
В настоящей работе изложены основные идеи и приемы, использованные при составлении
упомянутых процедур.
Функциональное преобразование признаков (ФПП)
Методы структурной идентификации регрессионной модели - сложная наука, а иногда
даже – искусство! Сначала следует подобрать и обосновать исходную структуру регрессии,
включающую все подозреваемые факторы, создать соответствующие базисные функции, или
ФПП, а только потом программа выбирает наилучшее в каком-то смысле подмножество базисных
функций. Например, теория подобия даёт структуру мультипликативных функций регрессии при
описании процессов в движущейся среде, в частности, - гидродинамики процессов массопереноса
(см. [Р6.3.1.2]). Можно подобрать дифференциальные уравнения этих процессов, интегралы
которых и дают обоснованную теорией структуру регрессионной функции, известную лишь с
точностью до параметров, которые, в свою очередь, и определяются по экспериментальным
данным. В ряде случаев удобно использовать ортогональные полиномы Чебышева, сплайн -
функции, функции Фурье и многие другие [17].
Обычно ФПП в программах РА осуществляется с помощью небольшого количества
встроенных функций [11]; для более сложных ФПП пользователю рекомендуется писать
собственную процедуру на алгоритмическом языке.
Процедура ФПП успешно используется для построения регрессионных моделей в основной
химической технологии (табл. 1).
Таблица 1
Некоторые функциональные преобразования признака, использованные для построения
регрессионных моделей в основной химической технологии (примеры)
Источник Функциональное преобразование признака
[2] X
1
/X
2
; lgX
2
; (X
1
/X
2
)
2
lgX
2