518 Глава 3. Статистика цепей Маркова с дискретным временем
исследовательских работ в НСА и работал на этой должности вплоть до выхода на пенсию
в 1962 г. После того он стал профессором в университете Джорджтауна. В 1942 г. майора
Кульбака командировали в Великобританию ознакомиться с тем, как англичане в Блетчли
-
парке дешифруют сообщения, генерируемые немецкими шифровальными машинами. Он внес
свой вклад в работу команды из Блетчли
-
парка и после возвращения в США возглавил
японскую секцию НСА. Его очень любили коллеги как по академической работе, так и по
работе в спецслужбах, за то что он был
«
абсолютно бесхитростным, вы всегда знали, что он
имеет в виду.
»
Ричард Лейблер (1914
–
2003) был американским математиком и криптографом. Он
участвовал во Второй мировой войне, в битвах при Иводзиме и в операции на Окинаве.
Наиболее выдающийся период его жизни связан с Институтом аналитических оборонных ис
-
следований (Institute of Defense Analysis) в Принстоне и с НСА. Он участвовал в программе,
позволившей команде НСА решить ранее не поддающиеся расшифровке советские разве
-
дывательные сообщения, поступавшие в рамках проекта под кодовым названием ВЕНОНА
(VENONA).
Статья Кульбака и Лейблера (Kullback S., Leibler R. A. On information and sufficiency
//
Annals of Mathematical Statistics. 1951. V. 22. P. 79
–
86), в которой было сформулировано
понятие информационной дивергенции, является, по
-
видимому, наибольшим академическим
достижением авторов. Статья появилась в разгар холодной войны и была немедленно
замечена в Советском Союзе, где существовало собственное мощное криптографическое
подразделение, связанное со спецслужбами. Следует отметить, что контроль за содержа
-
нием публикаций в рамках советской системы был, несомненно, более жестким, и статья,
написанная авторами, имеющими такой статус, как Кульбак и Лейблер, имела мало шансов
на публикацию в открытой академической печати. Однако в Советском Союзе существо
-
вала достаточно развитая сеть журналов и периодических изданий с грифами
«
секретно
»
и для
«
служебного пользования
»
, доступных только сотрудникам определенных учрежде
-
ний, имеющих так называемый
«
допуск
»
(получаемый только после тщательной проверки
и только на время выполнения соответствующих служебных обязанностей). Было возможно
даже получить степень кандидата либо доктора наук или быть избранным в Академию наук
СССР при очень небольшом числе публикаций, доступных широкой публике. (Таких ученых
часто называли
«
закрытыми
»
академиками; наиболее известным из них был академик Андрей
Дмитриевич Сахаров.)
§ 3.7. Скрытые марковские модели, I.
Оценивание состояний марковских цепей
Теперь приступим к изучению скрытых марковских моделей (с.м.м.).
Рассмотрим следующую ситуацию. Имеется ц.м.д.в. (X
m
) на пространстве
состояний I, скажем I
= {
1, . . . , s
}
, с (полностью или частично) неиз
-
вестным начальным распределением
=
(
i
) и (полностью или частично)
неизвестной переходной матрицей P
=
(p
ij
), i, j
=
1, . . . , s. В дополне
-
ние к этому цепь не является полностью наблюдаемой. Например, можно
наблюдать значения X
t
k
только в некоторые избранные моменты времени
t
0
, t
1
, . . . или можно фиксировать только значения b(X
1
), b(X
2
), . . . , где
b: I
→ K
неизвестная функция состояния, возможно случайная, со значе
-
ниями в новом
«
алфавите
»
K = {
1, . . . ,
κ}
(мы знаем, что неизвестного
мы не знаем). В типичных приложениях
κ <
s, а функция b многозначная.
§ 3.7. Скрытые марковские модели, I. Оценивание состояний марковских цепей 519
В задаче
«
без ограничений
»
пара ( , P) пробегает все множество
R
(см.
соотношение (3.1.5)) или его подмножество
R
in
(см. соотношение (3.1.6)).
Если мы избавимся от неопределенности, связанной с начальным распре
-
делением (а именно рассмотрим стационарную ц.м.д.в. с инвариантным
распределением ), то удобно будет предположить, что P
∈ P
IA
. Однако мы
можем обладать априорной информацией о (
, P), например что матрица
P внедиагональная (т. е. P
∈ P
off
-
diag
; ср. с соотношением (3.1.11)) или P
эрмитова (т. е. P
∈ P
symm
; ср. с соотношением (3.1.12)). Функцию b также
можно до некоторой степени конкретизировать, выделив (известный) класс
функций (например, для s
= κ
функция b может быть перестановкой).
В этом случае мы имеем дело с задачей
«
с ограничениями
»
.
Нередко возникает задача интерполяции, когда мы наблюдаем ц.м.д.в.
точно, но не во всякие моменты времени: мы видим ее состояния только
в (целые) моменты времени t
0
, . . . , t
m
, где 0
6
t
0
<
. . .
<
t
m
и t
m
>
>
m. Возможна ситуация, когда нужно скомбинировать две задачи, но для
простоты будем изучать их в отдельности.
Задача состоит в том, чтобы оценить
и P по фиксированной цепочке
наблюдаемых значений
0
=
b(X
0
), . . . ,
n
=
b(X
n
) или по заданной
последовательности состояний x
n
1
, x
n
2
, . . . , x
n
m
.
Пример 3.7.1. Вы наблюдаете цепочку
=
0
.
.
.
n
из нулей и единиц.
Вы подозреваете, что это запись (функции) цепи Маркова (X
m
) с тремя
состояниями, скажем A, B и C:
m
=
b(x
m
), где X
=
X
0
.
.
.
X
n
, x
=
x
0
.
.
.
x
n
.
Вы думаете, что цепь симметрична, т. е. ее матрица перехода P
=
(p
ij
),
i, j
=
A, B, C, имеет вид
P
=
1
−
2p p p
p 1
−
2p p
p p 1
−
2p
!
0
6
p
6
1
2
.
Возможны несколько предположений относительно того, какова функция
b: а) на двух состояниях b равна 0, скажем b(A)
=
b(B)
=
0, а на
оставшемся состоянии она равна 1: b(C)
=
1, или наоборот; б) на двух
состояниях b равна 0 с вероятностью q и 1 с вероятностью 1
−
q, в то
время как на оставшемся состоянии она равна 1 с вероятностью 1 (или
наоборот, 0 с вероятностью 1), в) каждая из величин b(A), b(B) и b(C)
принимает значение 0 с вероятностями q
A
, q
B
и q
C
или 1 с вероятностями
1
−
q
A
, 1
−
q
B
и 1
−
q
C
независимо друг от друга. Всего имеется 2 возможно
-