
– 21 –
1.4 Непараметрические методы классификации
Непараметрические методы классификации основаны на локальном оценива-
нии плотностей распределения p
y
(x) в окрестности классифицируемой точки x ∈ X.
Такой подход не требует знания функционального вида плотностей. Но априорная
информация всё равно привлекается — в виде метрики ρ(x, x
0
), оценивающей степень
сходства объектов в пространстве X.
1.4.1 Непараметрические оценки плотности распределения
Одномерная оценка плотности В одномерном случае X = R оценка плотно-
сти p(x) по случайной независимой выборке {x
1
, . . . , x
`
} даётся формулой Парзена-
Розенблатта (1956):
ˆp
h
(x) =
1
`h
`
X
i=1
K
µ
x − x
i
h
¶
, (1.8)
где K(z) — функция ядра, h — ширина окна. Ядро обязано быть чётной функцией
и удовлетворять условию нормировки
R
X
K(z) dz = 1. В этом случае
R
X
ˆp
h
(x) dx = 1,
то есть ˆp
h
(x) действительно является плотностью вероятности.
Если взять прямоугольное ядро K(z) =
1
2
£
|z| < 1
¤
, то выражение (1.8) определя-
ет отношение доли точек выборки, попавших внутрь окна, к ширине окна. Непрямо-
угольные ядра, убывающие с ростом |z|, придают точкам, далёким от x, меньший вес.
Следующая теорема показывает, что для широкого класса ядер оценка ˆp
h
(x) сходит-
ся к истинному значению плотности в точке x.
Утв. 1.1 Пусть функция K(z) непрерывна и ограничена,
R
X
K
2
(z) dz < ∞, после-
довательность h
n
такова, что h
n
→ 0 и nh
n
→ ∞ при n → ∞. Тогда ˆp
h
n
(x) → p(x)
для почти всех x ∈ X. Скорость сходимости имеет порядок O(n
−2/5
).
Многомерная оценка плотности Если в пространстве X задана метрика ρ(x, x
0
),
то оценка плотности легко обобщается на многомерный случай. Выпишем её для
каждого из классов y ∈ Y :
p
y
(x) =
1
`
y
C(h)
`
X
i=1
[y
i
= y] K
µ
ρ(x, x
i
)
h
¶
, (1.9)
где нормировка на C(h) гарантирует, что p
y
(x) — действительно плотность:
C(h) =
Z
X
K
µ
ρ(x, x
0
)
h
¶
dx.
Вычисление нормирующего множителя C(h) может оказаться сложной задачей при
некоторых ρ и K, но, к счастью, его можно избежать. В байесовском решающем пра-
виле множители C(h) сокращаются, если потребовать, чтобы C(h) не зависел от x
0
и от y. Первое требование означает, что форма окна не зависит от того, в какую точку
пространства его помещают. Второе требование означает, что для всех классов ис-
пользуется одна и та же ширина окна. При этом ширина окна вполне может зависеть
от самой точки x, что позволяет применять окна переменной ширины, о полезности
которых речь пойдёт ниже.