
103
Так как теория линейных моделей разработана наиболее полно, то на практи-
ке степенные уравнения регрессии часто преобразуют к линейному путем логариф-
мирования:
lg
~
lg lg lg ... lgyxxx
kk
=+ + +
01122
.
С помощью подстановок
lg ;
~~
/
xu и
jj
== lg y = z lg
ββ
0
0
приходят к получению
линейного уравнения регрессии:
~
...
/
Zuuu
kk
=+ + ++
ββ β β
01122
.
Путем подстановок
1
x
uu
j
== и x
j
гиперболическое и полиномиальное уравнения
так же могут быть преобразованы в линейные.
Предполагается, что случайная величина Y имеет нормальный закон распре-
деления с условным математическим ожиданием
~
Y
, являющимся функцией аргу-
ментов
x
j
(j=1, 2, ..., k), и постоянной, не зависящей от аргументов дисперсии
σ
2
.
В общем виде линейная связь регрессионного анализа может быть представ-
лена в следующем виде:
~
( , ,..., ) ,
Yxxx
jj k
j
n
=+
=
∑
βϕ ε
12
1
где:
•
ϕ
j
- некоторая функция переменных x
1
, x
2
, ... , x
k
;
•
ε
- случайная величина с нулевым математическим ожиданием M(
ε
)=0 и диспер-
сией
D(
ε
)=
σ
2
;
•
β
j -
коэффициенты уравнения регрессии.
Оценка неизвестных параметров
β
j
(j = 1, 2, 3, ..., k) по результатам выборки
объемом
n является основной задачей регрессионного анализа.
Для оценки неизвестных параметров уравнение регрессии чаще всего исполь-
зуют метод наименьших квадратов, который позволяет получить несмещенные
оценки. В случае линейной модели
b
j
будут несмещенными оценками с минималь-
ной дисперсией параметров
β
j
:
....
ˆ
22110 kk
xbxbxbby ++++=
5.2. Исходные предпосылки регрессионного анализа и свойства оценок
Применение методов наименьших квадратов для нахождения оценок пара-
метров простой множественной регрессии предполагает выполнение некоторых
предпосылок, касающихся прежде всего случайной переменной
ε
в уравнении
y=x
β
+
ε
, учитывающей ошибки измерения и ошибки спецификации. Эти предпосыл-
ки не определяются объемом выборки и числом включенных в анализ переменных.
1. Полагаем, что при заданных значениях переменных на переменную Y не
оказывают влияния никакие другие систематически действующие факторы и слу-
чайности, учитываемые с помощью ε, т.е.
M(
ε
)=0. Отсюда следует, что средний уро-
вень переменной Y определяется только функцией
xy
ˆ
и возмущающая пере-
менная
ε
не коррелирует со значениями регрессии.
2. Дисперсия случайной переменной
ε
должна быть для всех ε
i
одинакова и
постоянна:
M
i
()
εσ
ε
22
= . Это свойство переменной
ε
называется гомоскедастично-
стью и означает, что неучтенные факторы и модели оказывают одинаковое влияние.
3. Значение случайной переменной
ε
попарно не коррелированны, т.е.
M(
ε
i
ε
i-l
)=0 (для l≠0). В случае, когда исходные данные представляют собой времен-