Однако, как уже отмечалось, не все американцы обладают такими
характеристиками. Многие являются “белыми воротничками”, либо
специалистами, либо даже безработными, некоторые закончили только
начальную школу, у других – более высокое образование, иные имеют 10 или
20 детей, другие же не женаты и детей не имеют. Иными словами, “типичный”
американец представляет лишь среднюю тенденцию внутри совокупности, но
не отражает точно каждый отдельный признак. Ну, а поскольку такой
типичный признак найден, мы вправе задать вопросы:
“Насколько это типично? Насколько правильно эти усредненные признаки
отражают распределение свойств всех единиц массива по данной переменной?”
Мы ответим на них, если используем другой тип статистических расчетов –
дисперсию. Измеряя дисперсию, мы узнаем, как колеблется (варьирует)
отклонение от того среднего значения, которое мы нашли, в каких случаях
можно быть уверенным, что наше среднее значимо, и не является ли
отклонение [c.394] настолько большим, что наиболее типичный признак на
самом деле не является репрезентативным для всей совокупности.
В связи с этим возникает важная проблема, которую дует обсудить, прежде чем
двигаться куда-либо дальше. Статистика – это могучее средство анализа; она
можно сказать о наших данных гораздо больше, чем можно выявить любым
другим путем. Но сама по себе статистика бездумна. Можно произвести любые
статистические счеты на любом массиве данных и, казалось бы, выжать из
данных все до последней капли. Однако многие из этих “результатов” по двум
причинам могут оказаться бессмысленными. Первую причину мы уже
обсуждали, логика ее станет яснее по мере дальнейшего продвижения. Говоря
проще, уровень сложности анализа может превосходить уровень сложности,
заложенный в данных. Если выбранный нами метод требует сложить две
цифры, а данные основаны на номинальной шкале, для которой неприемлема
сама концепция сложения, то вообще-то механически можно сложить значения
двух кодов, однако результат этого окажется бесполезным. Так, если код 1
представляет рабочих – “синих воротничков”, код 2 – “белых воротничков”, а 3
– специалистов, то мы, конечно, можем к ому прибавить два и получить три, но
неужели мы действительно будем утверждать, что один рабочий – “синий
воротничок” плюс один рабочий – “белый воротничок” равны одному
специалисту? Конечно, нет.
Другая причина, по которой результаты статистические расчетов могут
оказаться незначимыми, –это то, что одна статистика сама по себе часто не
может представить всю картину целиком. Если единственный наиболее
типичный уровень образования американцев – это средняя школа, но только
25% всего населения достигли этого уровня и остановились на нем, то
насколько много в действительности может сказать нам это среднее значение?
Не так уж много. И много ли вы знаете людей, которые действительно имеют
1,7 ребенка? Таким образом, хотя мы можем точно подсчитать и представить