Crosstabs / Парная связь
Собрание наиболее популярных методов измерения парной связи (критерия Хи-квадрат и остатков по нему, коэффициентов Спирмена, Кендалла и Пирсона) в привязке к типам шкал исследуемых признаков.
Здесь же рассмотрены нулевые гипотезы, а также такие параметры связи как наличие-отсутствие, прямая-обратная, сильная-слабая, линейная-нелинейная.
Требуемый уровень подготовки пользователя: начальный.
Желательно владение методами: описательной статистики.
Краткое описание метода
Crosstabs / Парная связь
Видео-рекомендации, каждая не более 3 мин.
Видео 1. В серии видео рассматривается связь между возрастом (интервальная шкала), степенью интереса к политике (порядковая/ранговая шкала), участием в публичных демонстрациях (дихотомическая шкала) и рядом других переменных. При выборе метода парной связи необходимо ориентироваться именно на тип шкалы исследуемых переменных, причём ставить акцент на переменной с более "низким" уровнем измерения: в порядке убывания это интервальная (самый высокий тип) - ранговая - номинальная (самый низкий тип). В случае анализа связи между возрастом и интересом к политике более низким типом шкалы обладает вторая переменная (ранговая). К ранговым шкалам применим хи-квадрат и ранговые коэффициенты корреляции (Спирмена и Кендалла). Каждый из методов парной связи реализован в команде Crosstabs (в строки помещаются объясняющие или независимые переменные, в столбцы - объясняемые или зависимые).
Видео 2. При интерпретации значения коэффициентов корреляции необходимо учитывать исходную кодировку переменных (прямую или обратную). Выводы о значимости коэффициентов делаются на основании значения sig.: если это значение меньше принятого уровня значимости (обычно 0,05), то гипотеза о равенстве коэффициента нулю (то есть об отсутствии связи) отвергается, и тогда коэффициент - значим. Для того чтобы понять, между какими именно значениями (категориями) переменных присутствует связь, необходимо проанализировать стандартизованные остатки хи-квадрата (на уровне значимости 0,05 статистически значимыми будут остатки, по модулю превышающие 1,96).
Видео 3. Анализ стандартизованных остатков показывает: связь между возрастом и интересом к политике наблюдается только в некоторых возрастных категориях (молодым свойственно не интересоваться политикой, людям старшего возраста - интересоваться, для людей среднего возраста чёткой закономерности нет). Следующая рассматриваемая пара признаков - возраст и участие в демонстрациях. Поскольку вторая переменная дихотомическая, её можно рассматривать и как номинальную, и как интервальную. В настоящем случае она рассматривается как номинальная переменная. Если одна из переменных номинальная, то применим только хи-квадрат и его остатки.
Видео 4. Интерпретация значения хи-квадрата и его остатков.
Видео 5. Следующая пара исследуемых признаков - интерес к политике и участие в публичных акциях - анализируется с помощью хи-квадрата (поскольку одна из переменных номинальная). Следующие переменные - доверие разным политическим институтам, которые анализируются как псевдоинтервальные переменные, т.к. имеют большое количество градаций - 11. К (псевдо)интервальным переменным применимы хи-квадрат, ранговые коэффициенты и линейный коэффициент корреляции Пирсона.
Видео 6. Каждая из мер свидетельствует о наличии статистически значимой связи между уровнем доверия парламенту и законодательной системе, причём наиболее точной мерой можно назвать коэффициент Пирсона. Остатки хи-квадрата подтверждают эту тесную линейную связь: все наибольшие положительные остатки располагаются по главной диагонали таблицы сопряжённости. Значения ранговых коэффициентов также иллюстрируют и соответствие рангов признаков (с ростом рангов по одной переменной растут и ранги другой). Коэффициент Пирсона считается более точным, поскольку кроме рангов учитывает и расстояния между категориями. Ограничение коэффициента Пирсона в том, что он измеряет только линейную связь.
Видео 7. В случае, когда необходимо рассмотреть несколько пар переменных сразу (не номинальных), удобнее воспользоваться командой Correlate. Итак, при анализе парных связей необходимо иметь представление о 1) нулевых гипотезах, 2) типах шкал и соответствующих им мерах связи, 3) интерпретации наличия/отсутствия, значимости/незначимости, направления и силы связи,
4) возможности измерения связи в целом между признаками и связи между отдельными категориями признаков.
Комментарии можете оставлять прямо в Youtube