Коэффициент корреляции Пирсона
Для определения корреляционной зависимости между двумя случайными величинами используют коэффициент корреляции Пирсона. Заметим, что понятие корреляции является одним из основных понятий теории вероятностей и математической статистики; оно было введено Гальтоном и Пирсоном.
Рассмотрим пример распределения оценок, для которого использование коэффициента Спирмена нецелесообразно.
ученик | |||||
ЕГЭ по физике | |||||
ЕГЭ по математике |
В указанной таблице имеет место «скачок» в оценках по физике, выраженный в сильном различии оценок первого и второго учеников. Разница между этими оценками существенна и порождает неравномерность распределения оценок.
В подобных случаях рекомендуется применять выборочный коэффициент корреляции r Пирсона. Для его расчёта необходимо найти особую величину k(X,Y), называемую ковариацией.
Пусть величина X принимает значения x1, x2, …, xn, а величина Y – y1, y2, …, ym. Тогда можно найти выборочную среднюю для величины X и выборочную среднюю для величины Y. Если nij – это частота, с которой встречается в полученных выборках xi и yj, а n – объём выборки ( ), то ковариация k(X,Y) вычисляется по формуле:
Для малых выборок ковариацию удобно находить с помощью ковариационного графа, для построения которого необходимо вычислить выборочные средние для величин X, Y и относительные частоты . Ковариационный граф имеет вид:
Таким образом, ковариацию k(X,Y) можно находить как вес всего ковариационного графа. Заметим, что по корреляционному графу удобно находить и дисперсии случайных величин, которые также необходимы для вычисления коэффициента корреляции Пирсона.
Выборочный коэффициент корреляции определяется по формуле:
Для иллюстрации использования коэффициента корреляции и применения ковариационного графа рассмотрим пример. В выпускном классе проводились контрольные работы по физике и математике, которые дали следующие результаты:
«2» | «3» | «4» | «5» | |
«2» | 1 чел. | 2 чел. | 1 чел. | - |
«3» | 1 чел. | 4 чел. | 2 чел. | - |
«4» | - | 1 чел. | 3 чел. | 4 чел. |
«5» | - | 1 чел. | 3 чел. | 2 чел. |
Определим характер и силу связи между оценками в проведенных работах. Для этого найдём выборочную ковариацию и коэффициент корреляции.
Объём выборки равен n=25, т.к. контрольные работы писали 25 человек (сумма всех данных в таблице).
Пусть X – это оценки по физике, а Y – оценки по математике. Тогда по имеющейся таблице составим две таблицы (по строкам и столбцам) для нахождения выборочных средних.
По физике (величина X):
Оценка | «2» | «3» | «4» | «5» |
Количество чел. |
По математике (величина Y):
Оценка | «2» | «3» | «4» | «5» |
Количество чел. |
По данным таблицам находим выборочные средние:
После этого можно составить ковариационный граф.
Из построенного графа находим ковариацию:
По корреляционному графу находим и выборочные дисперсии: D(X)=(-1,64)2(0,04+0,08+0,04)+(-0,64)2(0,04+0,16+0,08)+ +(0,36)2(0,04+0,12+0,16)+(1,36)2(0,04+0,12+0,08)=1.03, аналогично вычисляем дисперсию D(Y)=0.82.
Поэтому Таким образом, между оценками по физике и математике в данной выборке существует прямая связь средней силы.
Ранговая корреляция Спирмена и выборочный коэффициент корреляции позволяют нам определить характер и силу связи для двух измеряемых величин. Но на практике педагогические и психологические эксперименты зачастую производят измерения большего количества величин. Например, тестирование учащихся может проводиться по таким параметрам, как трудолюбие, усидчивость, память, качество речи и т.д. Для того чтобы узнать, каким образом связаны все эти качества, можно использовать два следующих метода:
1.Рассматривают попарные связи и иллюстрируют их на корреляционных матрицах или корреляционных графах;
2.Находят множественный коэффициент ранговой корреляции – коэффициент конкордации.