
щий интервал, то по теореме Бернулли она будет сходиться по вероятности
при n → ∞ к вероятности попадания значения случайной величины ξ в со-
ответствующий интервал. Если случайная величина ξ непрерывная и f(x)
ее плотность, то огибающая (верхняя граница) гистограммы является ста-
тистическим аналогом для теоретической плотности f(x).
В методе гистограмм неизвестная плотность распределения прибли-
жается кусочно-постоянными функциями. Но точность приближения мож-
но улучшить, если применить кусочно-линейные функции. Для этой цели
строят полигон частот. Полигон частот – это ломаная линия, проходящая
через середины верхних границ прямоугольников гистограммы. Построен-
ная таким образом кусочно-линейная функция также является статистиче-
ским аналогом теоретической плотности (рис. 2).
Можно построить также кумуляту – ломаную с вершинами в точках
(a
i
;
1
n
P
i−1
j=1
n
j
). Кумулята дает представление о графике функции распреде-
ления, а гистограмма и полигон – о графике плотности распределения.
Еще раз отметим, что интерпретация графических характеристик
как статистических аналогов вероятностных характеристик имеет смысл и
обоснование только для выборки X из непрерывного распределения F .
3.2. Пример группировки выборки
Рассмотрим на примере, как сгруппировать выборку, состоящую из
1000 элементов. Пусть для определенности минимальный элемент выборки
равняется x
min
= 0, 01, а максимальный x
max
= 10, 65.
Определим сначала число интервалов k. Рекомендуется брать k такое,
что 2
k−1
∼ n.
В данном примере n = 1000.
2
10
= 1024 ∼ 1000; k − 1 = 10, k = 11.
Выберем число интервалов k = 11.
2. Определим длину интервала h:
h =
x
max
− x
min
k
.
Находим
h =
10, 65 − 0, 01
11
≈ 0, 967.
3. Найдем границы интервалов группировки x
0
= x
min
, x
i
= x
0
+
hi, i = 1, ..., k и составим таблицу группировки. Внесем границы интер-
валов в столбец «Интервал». Подсчитаем, сколько элементов выборки по-
пало в каждый интервал и заполним в таблице столбец «Численность n
i
».
28