
зависимых переменных: t.test(data[,1], data[,2], paired=TRUE). Тест Вилкоксона:
wilcox.test(data[,1], data[,2]). В любом случае, появится несвязанный текст, где
значение p-value будет указано в третьей строчке.
Как вы помните, различия между выборками хорошо иллюстрировать при
помощи графика "ящик с усами". Считается, что если "ящики"
перекрываются более, чем на 1/3 своей высоты, то выборки достоверно не
различаются.
А что если нам понадобится проанализировать различия между двумя
выборками, значения которых представлены только нулями и единицами?
Например, можно поставить вопрос: правда ли, что есть достоверная
разница между частотой забывания сменной обуви мальчиками и
девочками? Можно завести две колонки -- одну для мальчиков, другую для
девочек -- и ставить в соответствующую колонку 0, если ученик (ученица)
явились в школу без сменки, и 1, если он (она) принесли сменную обувь.
Конечно же, мы получим непараметрические данные, которые будут
анализироваться непараметрическим тестом хи-квадрат (Chi-square test,
модуль Nonparametrics/Distrib.: Analysis Startup Panel (вкладка
Nonparametric stats) 2 x 2 tables). Перед нами появляется четыре окошка:
пусть верхние два будут для мальчиков, а нижние два -- для девочек. В
левое окошко нужно ввести число приходов в школу со сменной обувью
(для каждого пола в свое окошко), а в правое -- без нее. Конечно же,
совершенно не важно, какую ячейку выбрать для мальчиков, а какую для
девочек, в какую заносить число нулей, а в какую -- число единиц, главное --
быть последовательным. При нажатии OK появляется длинная таблица, в
которой нам нужна строка Chi-square (а не похожая на нее, будьте
внимательны!), а точнее p-level, указанный в ней. Формулировка нулевой и
альтернативной гипотез, а также ход расссуждений при выборе гипотезы
точно такие же, что и в предыдущих двух тестах.
Используем команду chisq.test(). Пусть данные для мальчиков и девочек (нули и
единицы, а не их число!) будут первой и второй переменными наших данных:
chisq.test(data[,1], data[,2]). Значение p-value указано в третьей строчке появившегося
текста.
2.5.2.3. Три выборки и больше
А что если теперь мы захотим узнать, есть ли различия между тремя
выборками? Первое, что приходит в голову (предположим, что это