
процедуру NEIGHBOR. В этой процедуре для классификации наблюдений используют непа-
раметрическое правило "ближайших
соседей".
Программа CANDISC выполняет канонический
дискриминантный
анализ и связана с анализом основных компонентов и канонической кор-
реляцией. Процедуру STEPDISC можно использовать для выполнения пошагового дискрими-
нантного анализа.
В программном пакете BMDP для выполнения пошагового
д
искри
ми
нантного анализа
можно использовать программу Р7М. Но она не дает нормированные коэффициенты дискри-
минантной функции [19].
В
Minitab
дискриминантный анализ можно выполнить с
помощью
функции
Stats>Multivariate>Discrimmate
Analysis. Она позволяет вычислить как линейный, так и квад-
ратный дискриминантный анализ при разбиении (классификации) наблюдений на две или
больше групп. Дискриминантный анализ недоступен в Excel (версия 7.0 для PC).
Как и во множественном регрессионном анализе, использование дискриминантно-
го анализа первоначально
заключалось
в предсказании и определении сравнительной
важности независимых переменных. Главное отличие этих двух методов в том, что в
рамках множественной регрессии используют зависимую переменную, выраженную в
интервальной или относительной шкале, а в дискриминантном — категориальную за-
висимую переменную. В то время как множественный регрессионный анализ можно
использовать для определения степени покупательского интереса к данному товару,
дискриминантный анализ только установит принадлежность человека к группе поку-
пателей или непокупателей.
Один из вопросов для исследователя заключается в том, использовать "естественные
группы'
1
или
"искусственно
созданные". Например, если вас интересует возраст респонден-
тов, то вы часто собираете данные по возрастным категориям, а не используете фактический
возраст респондентов. В этом случае используемые категории определят результат анализа, в
котором они должны выступать как зависимая переменная. Объединяя людей в усреднен-
ные возрастные группы, вы можете увидеть различия между ними. Взгляд на детальные
данные позволит вам сделать определенные выводы о создании больших по размеру групп
респондентов,
исходя из любого частного показателя. В другой ситуации вы можете также
собрать данные о том, проживает респондент один в квартире или с кем-то. Для описания
условий проживания естественно использовать номинальные категории, поскольку трудно
подобрать показатели, измеряемые по интервальной шкале. Если группы выбраны пра-
вильно, то это вселяет уверенность в качестве результатов.
В ходе проведенного Burke маркетингового исследования использования торговой марки
получена следующая классификационная матрица. Каждому респонденту задали вопрос:
старается ли он покупать товары определенной торговой марки? Далее попытались разли-
чить респондентов, исходя из их оценок выгод, которые приносит обладание данным това-
ром. Каждый респондент рассматривался с точки зрения того, придерживаются они покупок
товара определенной торговой марки или нет. Из всей выборки 30% (60 человек) ответили,
что они не стремятся купить товар определенной торговой марки, а 70%
{202
человека) —
стремятся. Обычно при непропорциональном распределении групп среди населения ожи-
дают, что большая по размеру группа будет предсказана с большей точностью по сравнению
с меньшей. Об этом свидетельствует тот факт, что если использовать для прогноза случай-
ный выбор, то к первой группе (приверженцев торговой марки) будет отнесено 49% (0,7 *
0,7), а ко второй 9% (0,3 * 0,3). Процент неверно классифицированных респондентов соста-
вит 42% от всего числа (0,3 * 0,7 + 0,7 * 0,3). Эта модель классифицирует меньшую группу
(неприверженцев торговой марки) менее точно, чем группу приверженцев, но все равно
точнее, чем при отнесении респондентов к группе методом случайного выбора.
Кроме того, маркетологи выполнили перекрестную проверку с помощью программы
SPSS. В этой программе дискриминантную модель пересчитывают столько раз, сколько
рее-
!
пондентов в выборке. Каждый пересчет исключает одного респондента, и модель использу- |
Глава 18. Дискриминантный анализ 709