
65
5. КЛАСТЕРНЫЙ АНАЛИЗ
“Любая наблюдаемая статистическая закономерность
имеет тенденцию разрушаться, как только с целью
контроля на нее оказывается давление”.
Чарльз Гудхарт
5.1. ОБЩИЕ СВЕДЕНИЯ
Кластерный анализ – один из методов многомерного анализа,
предназначенный для группировки (кластеризации) совокупности
элементов, которые характеризуются многими факторами, и получения
однородных групп (кластеров). Разбиение на кластеры происходит с
помощью некоторой метрики, например, евклидова расстояния. Задача
кластерного анализа состоит в представлении исходной информации об
элементах в сжатом виде без ее существенной потери.
Пример 4.1. Рассмотрим абстрактный пример. Двадцать банков,
акции которых котируются на рынке, предоставили следующую
информацию (табл. 5.1), где X – затраты за прошлый период, Y – прибыль
за прошлый период. Необходимо выяснить акции каких банков имеет
смысл приобрести (Buy), каких – придержать (Hold), а от каких –
избавиться (Sell).
Графическое представление исходных данных приводится на рис. 5.1.
Мы заранее облегчили работу себе
и программному пакету STATISTICA,
разбив эти данные на кластеры. Совсем не нужно обладать какими-либо
познаниями в области кластерного анализа, чтобы решить эту задачу.
Сравнивая первую (1, 20, 7,16, 8, 17, 11) и вторую группу банков (2, 15, 6,
3, 12, 19) можно сказать, что вторая группа предпочтительнее, так как при
одних и тех же затратах вторая группа получает больше прибыли.
Сравнивая первую группу банков с
третьей (4, 13, 5, 9, 10, 14, 18),
предпочтительнее первая группа, так как при одной и той же прибыли
затраты у нее меньше.
Таблица 5.1
Номер банка Затраты X Прибыль Y Рекомендация
1 4 2 Hold
2 6 10 Buy
3 5 7 Buy
4 12 3 Sell
5 17 4 Sell
6 3 10 Buy
7 6 1 Hold
8 6 3 Hold
9 15 1 Sell
10 15 4 Sell
11 5 4 Hold