• формат doc
  • размер 579.02 КБ
  • добавлен 17 декабря 2011 г.
Двоенко С.Д. Конспект лекций по курсу Методы анализа больших массивов данных
Тульский государственный университет, 2001, 93 с.
Содержание.
Введение в анализ данных.
Проблема обработки данных.
Матрица данных.
Гипотезы компактности и скрытых факторов.
Структура матрицы данных и задачи обработки.
Матрица объект-объект и признак-признак. Расстояние и бли-зость.
Измерение признаков.
Отношения и их представление.
Основные проблемы измерений.
Основные типы шкал.
Проблема адекватности.
Основы анализа связей.
Предположение о природе связи.
Нормальное распределение.
Корреляционная матрица и ее основные свойства.
Собственные векторы и собственные числа корреляционной матрицы.
Приведение корреляционной матрицы к диагональной форме.
Геометрическая интерпретация главных компонент на плоско-сти.
Модель главных компонент.
Приближенное вычисление собственных чисел и векторов корреляционной матрицы.
Понятие об измерении связи между качественными признака-ми. Статистический подход.
Теоретико-информационный подход.
Проблема интерпретации значений коэффициентов связи.
Задача факторного анализа.
Модель факторного анализа.
Структура факторных уравнений.
Неоднозначность факторного решения.
Метод главных факторов.
Метод центроидных факторов.
Проблема оценки значений факторов и виды факторных моде-лей.
Оценки общностей и вращение факторов.
Экстремальная группировка признаков (параметров).
Алгоритмы экстремальной группировки.
Задачи классификации и кластер-анализа.
Постановка задач классификации и кластер-анализа.
Байесовское решающее правило классификации.
Вероятности ошибок байесовского классификатора.
Формирование решающего правила как обучение распознава-нию образов.
Восстановление плотностей распределения классов.
Восстановление функций степени достоверности.
Минимизация среднего риска.
Линейные разделяющие функции.
Область решений линейной разделяющей функции.
Алгоритмы построения разделяющих гиперплоскостей.
Алгоритм построения оптимальной разделяющей гиперпло-скости.
Алгоритмы кластер-анализа.