Коэффициент конкордации.

По-другому коэффициент множественной ранговой корреляции называют коэффициентом конкордации. Задача, решаемая с помощью этого коэффициента, больше всего напоминает однофакторный дисперсионный анализ, но шкала измеряемого признака может быть не интервальной, а порядковой.

 

Предположим, у нас есть N объектов, характеризующихся некоторым количеством признаков (обозначим число признаков буквой К). Например, это могут быть 7 хозяйств, различающихся по трем экономическим показателям (N=7, К=3). По этим показателям хозяйства должно быть возможным ранжировать, т.е. расположить в порядке возрастания. Это указывает на то, что показатели должны измеряться по порядковым или интервальным шкалам.

 

Требуется проверить, сходный ли смысл имеют экономические показатели, выбранные нами для анализа. Если все показатели либо одновременно велики, либо одновременно малы, то можно считать, что система показателей внутренне согласована (отсюда и название: «конкордация» обозначает «согласование»). По-другому это можно сказать так: в среднем все показатели коррелируют между собой. Однако для проверки мы традиционно используем более нейтральный факт и проверяем гипотезу, что все признаки независимы (одновременно). Альтернативной гипотезой будет согласованность признаков.

 

Конечно, можно попарно вычислять и проверять значимость коэффициентов ранговой корреляции (Спирмена или Кендалла). Но благодаря наличию статистического разброса и большому числу этих сравнений мы все равно иногда будем получать значимые коэффициенты ранговой корреляции даже в случае абсолютной несогласованности (все коэффициенты измеряют не связанные факторы).

 

На первом этапе вычисления коэффициента множественной ранговой корреляции мы должны проделать такое ранжирование по каждому включенному в анализ показателю, т.е. присвоить объектам ранги. Как это делается, уже было рассказано ранее. Для нашего примера в результате ранжирования мы получим данные примерно следующего вида:

 

Хозяйство Ранги по экономическим показателям:
Зерновые Мясо Молоко
«Дружба»
«Победа»
«Стрела»
«Спутник»
«Знамя»
«Ударник»
«Вымпел»

 

Для удобства дальнейших рассуждений мы расположили хозяйства по возрастанию рангов первого показателя (зерновые). В этих же целях по третьему показателю мы взяли в качестве примера обратное расположение рангов по. Данный пример учебный, в действительности так, скорее всего, не будет.

 

Переход к рангам автоматически выравнивает значимость показателей, даже если шкалы для их измерения были несопоставимы (например, средние значения 1000 километров и 5 килограммов). Попытка вычислить коэффициент, используя не ранги, а сами значения, приведет к ошибке.

 

Следующий шаг вычисления – суммирование рангов по всем (трем) показателям для каждого хозяйства. Результаты приведены в 5-м столбце таблицы:

 

Хозяйство Ранги по экономическим показателям:   Σ   Δi   Δi2
Зерновые Мясо Молоко
«Дружба»
«Победа» -1
«Стрела»
«Спутник»
«Знамя» -3
«Ударник»
«Вымпел» -2

 

Поставим вопрос: как будут выглядеть наши данные, если гипотеза верна и показатели действительно независимы. Если например, ранг по первому признаку будет большой, то по второму он может оказаться с равной вероятностью как большим, так и маленьким. По третьему признаку – тоже, и т. д. Если признаков много, то среднее значение суммы рангов у всех объектов (в нашем случае – хозяйств) будет примерно одинаково. Это среднее значение легко найти, если просуммировать все ранги в таблице и разделить на число признаков К. Поскольку все ранги известны заранее (порядковые номера от 1 до N, встречаются каждый по одному разу), то значение среднего ранга суммы зависит только от К и N и не зависит от того, какие конкретно ранги получили объекты. Оно всегда равно . В нашем примере для K=3 и N=7 средний ранг суммы равен Это же значение можно было получить и найдя среднее значение суммы рангов напрямую:

 

В 6-м столбце таблицы расположены разности Δi между конкретным значением суммы рангов и средним значением . Например, для хозяйства «Дружба» Δi = 13-12=1. При правильных вычислениях сумма этого столбца, естественно, равна 0. Поэтому в коэффициенте используются квадраты разностей Δi2. Они вычислены в последнем столбце таблицы.

 

Сумма квадратов разностей равна .

 

На основании данной суммы вычисляем коэффициент множественной ранговой корреляции по следующей формуле:

 

Смысл этой формулы – отношение суммы квадратов разностей к максимально возможному значению этой суммы, равному Очевидно, что коэффициент при этом не превышает 1. Он достигает 1 только тогда, когда все ранги для каждого объекта одинаковые, т.е. наблюдается полная согласованность. Коэффициент равен 0 только тогда, когда для всех объектов сумма рангов равна среднему значению этой суммы. В нашем примере значение W равно:

 

Осталось проверить гипотезу о том, значима ли такая величина коэффициента множественной ранговой корреляции. Проверять будем с помощью распределения хи-квадрат. Для этого выбираем уровень значимости α. Выберем, например, α=0,01. По таблице распределения хи-квадрат с N-1 степенями свободы (в нашем примере N-1=6) смотрим критическое значение хи-квадрат для этого уровня значимости. (в нашем примере χ2крит=16,81.

 

Экспериментальное значение хи-квадрат вычисляем по формуле

Вычисления для нашего примера дают

Сравниваем экспериментальное значение χ2крит =2,0 с критическим χ2крит=16,81. Поскольку экспериментальное значение меньше критического, можно считать, что признаки (в нашем случае это экономические показатели) можно считать в среднем независимыми.

 

Обратите внимание, что этот критерий предполагает только проверку наличие согласованности всех признаков одновременно. В нашем примере четко прослеживается отрицательная связь первого и третьего фактора: чем больше ранг по зерновым, тем меньше ранг по молоку. Однако за счет присутствия третьего фактора эта связь может оказаться недостаточно существенной. Для более подробного анализа можно использовать коэффициенты ранговой корреляции.

 

27. Шкалы качественных и количественных признаков. Свойства шкал.

Шкалы количественных признаков: интервальная, отношений, разностей, абсолютная

Шкалы качественных признаков: порядковая, наименований.