528 Глава 3. Статистика цепей Маркова с дискретным временем
b
p
∗
ij
=
c
ij
s
X
m
=
1
c
im
, i, j
=
1, . . . , s (3.7.23)
и
b
q
∗
jk
=
d
jk
κ
X
k
=
1
d
jk
, j
=
1, . . . , s, k
=
1, . . . ,
κ
. (3.7.24)
Читатель должен иметь в виду, что вероятности
b
∗
j
,
b
p
∗
ij
и
b
q
∗
jk
являются
функциями модели Z и последовательности
.
Значит, если модель
b
Z
∗
принадлежит
Z
, то она обеспечивает
«
усовер
-
шенствование
»
модели Z в этом классе. Например, в примере 3.7.3, где
переходная матрица P имеет все нулевые диагональные элементы p
ii
=
0,
переходная матрица
b
P
∗
=
(
b
p
∗
ij
) из соотношения (3.7.23) сохраняет то же
свойство.
Знаменатели соотношений (3.7.22), (3.7.24) можно упростить. В самом
деле, заметим, что
s
X
j
=
1
e
j
=
t
X
l
=
1
s
X
j
=
1
r
j
(l)
=
t
X
l
=
1
u
l
=
P (b(X)
=
; Z)
и
n
j
:
=
κ
X
k
=
1
d
jk
=
E
Z
(число посещений состояния j до момента времени n),
где E
Z
обозначает математическое ожидание по мере P
Z
. Используя эти
равенства, можно переписать соотношения (3.7.22)
–
(3.7.24) в компактной
форме:
b
∗
j
=
e
j
/
P
Z
(b(X)
=
),
b
p
∗
ij
=
c
ij
s
X
m
=
1
c
im
и
b
q
∗
jk
=
d
jk
/
n
j
. (3.7.25)
В общем случае нам необходимо решить задачу с ограничениями
минимизировать правую часть (3.7.21) по
b
Z для заданного Z
при условии, что
b
Z
∈ Z
. (3.7.26)
Это наводит на мысль о следующем
«
обучающем
»
алгоритме: при заданной
начальной модели Z
(0)
∈ Z
и обучающей последовательности решить за
-
дачу (3.7.26), получив, таким образом, улучшенную модель Z
(1)
=
b
Z
∗
∈ Z
.
§ 3.7. Скрытые марковские модели, I. Оценивание состояний марковских цепей 529
Затем повторить это для Z
(1)
и , и т. д. Предположим, что минимизатор
Z
(N)
, полученный в результате N итераций, сходится к пределу:
lim
N
→∞
Z
(N)
=
Z
(
∞
)
∈ Z
. (3.7.27)
Тогда Z
(
∞
)
можно рассматривать как
«
наилучшую подгонку
»
модели, на
которую способен этот алгоритм.
Возникают следующие вопросы. 1. Существует ли предел Z
(
∞
)
в соот
-
ношении (3.7.27) (для всех или некоторых начальных моделей Z
(0)
)? 2.
Если предел Z
(
∞
)
в соотношении (3.7.27) существует, совпадает ли он
со значением, где достигается максимум Z
∗
МП
из соотношения (3.7.10)?
Как было отмечено, эти вопросы стали поводом для появления обширной
литературы, охватывающей ряд важных приложений. Некоторые из ре
-
зультатов в этом направлении обсуждаются в § 3.9. Сейчас мы хотели бы
привести список относящихся к этой теме работ Леонарда Баума, которого
многие считают создателем теории с.м.м. (вместе с Ллойдом Уэлчем):
Baum, L.E. An inequality and associated maximization technique in
statistical estimation for probabilistic functions of Markov processes. In:
Inequalities, III (Proc. Third Sympos., Univ. California, Los Angeles, CA,
1969; dedicated to the memory of T.S. Motzkin). New York: Academic Press,
1972, pp. 1
–
8.
Baum, L.E., Petrie, T., Soules, G. Weiss, N. A maximization technique
occurring in the statistical analysis of probabilistic functions of Markov chains.
Annals Math. Statist., 41 (1970), 164
–
171.
Baum, L.E., Sell, G.R. Growth transformations for functions on manifolds.
Pacific Journ. Math., 27 (1968), 211
–
227.
Baum, L.E., Eagon, J.A. An inequality with applications to statistical
estimation for probabilistic functions of Markov processes and to a model for
ecology. Bull. Amer. Math. Soc., 73 (1967), 360
–
363.
Baum, L.E., Petrie, T. Statistical inference for probabilistic functions of
finite state Markov chains. Annals Math. Statist., 37 (1966), 1554
–
1563.
Алгоритм, приведенный выше, называют обучающим алгоритмом
Баума
—
Уэлча; его привлекательность заключается в простоте (а потому
и в практичности) решения задачи (3.7.26) для различных множеств
Z
, что
и продемонстрировали формулы (3.7.22)
–
(3.7.25).
Удобно связать с равенствами (3.7.22)
–
(3.7.25) отображение
Φ
:
U → U
множества
U
(см. (3.7.11)) в себя
Φ
: Z
=
( , P, Q)
7→
b
Z
∗
=
(
b
∗
,
b
P
∗
,
b
Q
∗
), (3.7.28)
которое мы назовем преобразованием Баума
—
Уэлча для фильтрации
(без ограничений). (При этом формулы (3.7.22)
–
(3.7.25) будут переписаны