доверительного уровня 0,95 вероятность этого составит 0,05 или 1 – 0,95, для
доверительного уровня 0,99 – 0,01. Эти величины 0,05 и 0,01 или 5% и 1%
свидетельствуют о том, что любое обобщение, [c.411] сделанное по выборке и
относящееся к генеральной совокупности, даже подпадающее под
подсчитанный уровень ошибки выборки, просто-напросто неверно.
Проверки на статистическую значимость играют ту же роль для оценки
измерений связи. Они определяют, насколько вероятна связь, зафиксированная
между двумя признаками в выборке. Давайте попробуем пояснить этот пункт.
Продолжая наш пример, представьте, что у нас есть совокупность из 200 стран,
для которых доподлинно известно, что коэффициент связи между количеством
населения и долей взрослых, получивших высшее образование, равен 0, т. е. в
реальности такой связи нет. Представьте далее, что в силу тех или иных причин
мы считаем необходимым взять выборку только в 30 стран и подсчитать для
них связь между этими двумя переменными. Он также может оказаться равным
0, но в действительности это маловероятно, поскольку сила связи теперь
зависит не от всех 200 стран, а только от 30 и, возможно, будет отражать их
характерные особенности. Другими словами, величина коэффициента
предопределена тем, какие именно 30 стран мы выберем. Если случайно мы
выберем те 30 стран, которые действительно репрезентативны относительно
всех 200, связь не обнаружится. Но тот же случай может привести нас к тому,
что мы выберем такие 30 стран, для которых связь между количеством
населения и уровнем образования необычайно высока, скажем 0,60. В этом
случае наш подсчитанный со всей тщательностью коэффициент будет
характеризовать данную выборку, но, если мы распространим эту
характеристику на генеральную совокупность, наши выводы будут неверны.
Зная это, конечно, необходимо отвергнуть измерение связи на основании
именно этой выборки.
Проблема заключается в том, что в действительности мы не знаем глубинные
параметры совокупности, например истинную степень связи признаков в ней.
Безусловно, причина, по которой мы вынуждены прибегать к выборкам, прежде
всего в том, что мы просто не в состоянии изучать совокупности в целом. А
отсюда в свою очередь следует, что чаще всего мы будем иметь в
распоряжении только те проверки связей, которые основаны на выборках.
Более того, эти подсчеты будут основаны только на одной выборке. Тогда
встает вопрос, насколько можно [c.412] быть уверенным в том, что проверка
связей, основанная на единственной подгруппе генеральной совокупности,
точно отражает глубинные характеристики этой совокупности. Задача проверки
на статистическую значимость и заключается в том, чтобы дать цифровое
выражение этой уверенности, измерить возможность или вероятность того, что
мы делаем верные, или, наоборот, неверные обобщения.