124
1.9.1 Основная цель и терминология
Один общий вопрос объединяет исследователей всех областей естествозна-
ния. Он состоит в том, как организовать наблюдаемые данные в относительно
однородные структуры, закономерно отличающиеся друг от друга. Эти структуры
называются классификациями, а их элементы- таксонами. Правильная классифи-
кация предметной области (т.е. самодостаточная и логически непротиворечивая)
сама
по себе является крупным научным открытием.
Однако, далеко не все классификации так бесспорны как периодическая таб-
лица Д. И. Менделеева, буквально раскрывающая тайны строения материи. На-
пример, в биологии насекомые отличаются от животных по совершенно формаль-
ному признаку- они имеют шесть ног. Это означает, что паук не является насеко-
мым, хотя
целиком состоит из хитина, как и мухи, которыми он питается.
Вообще говоря, любая классификация, по сути, является формальным про-
изведением, но только одна из них полностью содержательна, т.е. соответствует
внутренней природе вещей, непротиворечиво описывая конкретную предметную
область. Эта идея лежит в основе автоматического создания искусственных клас-
сификаций для их
последующего осмысления и содержательного толкования. По-
нятно, что число вариантов подобных классификаций бесконечно и на их качест-
во, помимо методики, влияет набор признаков лежащих в основе таксономии.
Наиболее известные процедуры искусственной классификации связаны с т.н.
кластерным анализом. Название этого метода происходит от англоязычного тер-
мина claster, что означает скопление,
пучок, группа элементов, характеризую-
щихся каким-либо общим свойством. Собственно кластерный анализ объединяет
множество методов интеграции явлений любой природы в однородные группы
[9]. Эта однородность должна пониматься как относительная близость сравнивае-
мых объектов в многомерном пространстве выбранных признаков, что само по
себе не гарантирует истинность формальных классификаций. Смена признаковых
координат, почти
наверняка приведёт к новым кластерным решениям.