
Многомерный дисперсионный анализ (MANOVA, от английского
Multivariate ANalysis Of VAriance) позволяет вычислить вероятность
существования различий между несколькими группами объектов по
совокупности их признаков. Предполагается, что принадлежность всех
объектов к группам вам уже известна. Нулевая гипотеза: группы не
различаются между собой по совокупности признаков. Альтернативная
гипотеза: хотя бы одна пара групп различается между собой хотя бы по
одному признаку. Обратите внимание на формулировку альтернативной
гипотезы!
Выбираем независимую переменную (Variables Independent (factors)), в
которой указаны группы, куда принадлежат объекты, и зависимые
переменные (Variables Dependent) – то есть признаки этих объектов.
Нажимаем OK All effects. В появившейся таблице нас, как вы помните,
интересует p-value. Если оно больше или равно 0,05, то верна нулевая
гипотеза, а если меньше 0,05 – то альтернативная. Если верна
альтернативная гипотеза, то можно, так же, как и для ANOVA, выяснить,
благодаря каким признакам какие группы различаются между собой, при
помощи Tukey test. Напоминаю, что для этого нужно вместо All effects
выбрать Post hoc comparisons Tukey honest significant difference (HSD) test,
а там перебирать все признаки по одному. Для каждого признака можно
увидеть таблицу, где будут указаны p-value для всех пар групп. Естественно,
что те пары групп, p-value для которых меньше 0,05, достоверно
различаются между собой по выбранному признаку (обычно они
выделяются красным цветом).
Для проверки достоверности классификации в целом используем две
последовательные команды: summary(manova(as.matrix(data[,1:5]) ~ data[,6]),
test=”Wilks”). Для того чтобы исследовать различия групп по отдельным признакам,
нужно использовать две другие последовательные команды:
summary(aov(as.matrix(data[,1:5]) ~ data[,6])). Для каждого признака появляется своя
таблица, в которой символом указано значение p-value.