Probit Regression / Пробит-регрессия
Метод для поиска зависимости категориальной переменной от интревальных и метрических предикторов, а также одного категориального.
Метод, похожий на логистическую регрессию, но основанный не на моделировании логарифма отношения вероятностей интересующих категорий зависимой переменной, а на моделировании аргумента функции нормального распределtния, через которую и рассчитывается вероятность интересующей категории зависимой переменной.
Требуемый уровень подготовки пользователя: высокий.
Краткое описание метода
Probit Regression / Пробит-регрессия
Видео-рекомендации, каждая не более 3 мин.
Видео 1. Рассмотрение результатов дискриминантного анализа, расчет скоринга.
Видео 2. Роль категориальных переменных в линейном многочлене (на примере страны): если в линейной комбинации итоговой модели остался набор дихотомических переменных о стране проживания респондента, это говорит о том, что форма зависимости между зависимой переменной и оставшимися независимыми переменными в этих странах одинакова, различается только сдвиг линии зависимости по оси Y.
Видео 3. Сдвиг линии графика или изменение наклона графика? Если речь идет о втором, линейный многочлен должен задаваться иначе - через перемножение предикторов. Определить, различается ли наклон, можно при помощи пробит-регрессии.
Видео 4. Для работы с пробит-регрессией необходимо перейти от базы с респондентами к базе с профилями и весами профилей (числом респондентов, соответствующих профилям). Подготовка массива: отбор переменных, создание новой, работа с пропусками.
Видео 5. Подготовка массива: работа с пропусками, запуск Custom table (для работы с этой командой необходимо изменить тип шкалы всех используемых переменных на категориальный - ранговый или номинальный).
Видео 6. Подготовка профилей: работа с Custom Tables, перенос данных в Excel, удаление дубликатов, повторный запуск Custom table.
Видео 7. Перенос профилей в SPSS.
Видео 8. Запуск Probit regression и Parallelism test (проверяет статистическую гипотезу о равенстве наклона линий для разных категорий "факторной" переменной, в настоящем случае - страны). Если гипотеза в Parallelism test отвергается, то наклон линии все же зависит от этой переменной.
Видео 9. Интерпретация Parallelism test и Pearson Goodness-of-Fit Test, показывающего качество подгонки предсказанных значений относительно эмпирических (если гипотеза в этом тесте отвергается, то это это говорит о низком качестве модели, т.е. о значимом несоответствии наблюдаемых и предсказанных значений). Если гипотеза в Parallelism test принимается, то можно интерпретировать и результаты пробит-регрессии (Parameter Estimates).
Видео 10. Summary: в рассматриваемом кейсе форма зависимости между участием в профсоюзных или аналогичных организациях и другими предикторами всё же различается от страны к стране, что противоречит результатам дискриминантного анализа. Возможная стратегия дальнейшей работы над кейсом - применение логлинейного анализа.