
Если число данных четное, то медиана равна полусумме двух серединных значений. Медиа-
на—
это 50-й
процентиль.
Она характеризует положение центра
распределения
порядковых
данных. В табл. 15.2 медиана равна 5,000.
Медиана (median)
Значение переменной, которое приходится на середину распределения частот, т.е. одна по-
ловина всех
значений
больше медианы, а
другая
половина - меньше.
Как видно из табл. 15.2, три показателя,
характеризующих
положение центра распределе-
ния для рассматриваемого нами примера, различны (среднее значение — 4,724; мода — 6,000;
медиана — 5,000). И это неудивительно, поскольку каждый показатель определяет центр рас-
пределения по-разному. Какой же показатель использовать? Если переменную измеряют по
номинальной шкале, то лучше использовать моду. Если переменную измеряют по порядковой
шкале, то больше подходит медиана. Если же переменную измеряют по интервальной или от-
носительной шкале, то мода плохо отражает положение центра распределения. Это можно уви-
деть из табл. 15.2. Хотя значение моды, равное 6,000, отражает наивысшую частоту, оно пред-
ставляет только 27,6% выборки. Медиана лучше подходит в качестве показателя, характери-
зующего положение центра распределения, для интервальной или относительной шкалы, хотя
и она не учитывает имеющуюся информацию о переменной. Текущие значения переменной до
и после медианы игнорируются. Самый лучший показатель для интервальной или относи-
тельной шкалы — среднее арифметическое. Он учитывает всю доступную информацию, по-
скольку для его вычисления используются все значения. Однако среднее арифметическое чув-
ствительно к выбросам значений (экстремально малым или экстремально большим значени-
ям). Если данные содержат выбросы, то среднее не будет хорошим показателем центра
распределения и лучше использовать два показателя — среднее и медиану.
Показатели вариации
Показатели
вариации
(изменчивости) (measures of variability), вычисляемые на основании
данных, измеряемых с
помощью
интервальных или относительных шкал, включают размах
вариации, межквартильный размах, дисперсию, стандартное отклонение и коэффициент
вариации.
Показатели вариации
(изменчивости)
(measures
of variability)
Статистики, показывающие меру разброса (вариабельность)
значений
переменной.
Размах вариации (range) отражает разброс данных. Он равен разности между наибольшим и
наименьшим значениями в выборке. Поэтому на него непосредственно влияют выбросы.
Размах вариации (range)
Разность между наибольшим и наименьшим
значениями
переменной в вариационном
ряду.
Размах =
X
uacfumihligf
-
Х
на!ме
„
ьа1С1
Если все значения данных умножить на константу, то значение размаха вариации умножа-
ется на ту же константу. Размах вариации в табл. 15.2 равен: 7 — 2
=
5,000.
Межквартильный размах (interquartile range) — это разность между 75- и 25-м
процентиля-
ми. Для набора точек данных, расположенных в ранжированном ряду,
/>-м
процентилем
будет
такое значение переменной в ранжированном ряду распределения,
что/>%
единиц совокупно-
сти будут меньше и (100 —
р)%
— больше него. Если все значения данных умножить на кон-
станту, то межквартильный размах умножается на эту же константу. Межквартильный размах в
табл. 15.2 равен 6 - 3 = 3,000.
Глава 15. Вариационный
ряд,
таблицы сопряженности признаков и проверка гипотез 559