Ковариация и корреляция
Выборочной ковариацией двух переменных х, у называется средняя величина произведения отклонений этих переменных от своих средних, т. е.
или
где , — выборочные средние переменных х, у.
Ковариацию можно вычислить с помощью функции Excel КОВАР(массив1; массив2), где Массив 1 и 2 ¾ это значения x и y.
Выборочная ковариация является мерой взаимосвязи между двумя переменными.
Пусть данные наблюдений переменных х, у представлены в виде точечного графика – диаграммы рассеяния наблюдений
Точка на диаграмме является центром рассеяния переменных х, у.
Вертикальная и горизонтальная прямые, проведенные через точку , разделяют диаграмму рассеяния на четыре области.
Наблюдения в областях I, III дают положительный вклад в ковариацию, а в областях II, IV — отрицательный.
Если положительные вклады преобладают над отрицательными, то ковариация будет положительной, в противном случае она будет отрицательной. Положительной ковариации отвечает положительная связь, а отрицательной — отрицательная.
При положительной (прямой) связи с увеличением одной переменной другая переменная в среднем также увеличивается, и наоборот при отрицательной (обратной) связи.
Заметим, что
Свойства ковариации:
1) ;
2) , где а – константа;
3) , где а – константа;
4)
Пусть выборка извлечена из нормальной генеральной совокупности и отражает ее свойства.
Если случайные величины X, У независимы, то ковариация равна нулюи выборочные точки на диаграмме рассеяния наблюдений можно заключить в окружность с центром в точке .
Если X, У зависимы, то ковариация отлична от нуляи выборочные точки можно заключить в эллипс с центром в точке , при этом положение большей полуоси эллипса будет указывать направление связи (положительная или отрицательная).
Более точной мерой зависимости между величинами является коэффициент корреляции.
Выборочный коэффициент корреляцииопределяется выражением
,
он является безразмерной величиной и показывает степень линейной связи двух переменных.
Коэффициент корреляции можно вычислить с помощью функции Excel КОРРЕЛ(массив1; массив2), где Массив 1 и 2 ¾ это значения x и y.
Свойства коэффициента корреляции:
1) ;
2) ;
3) если , то X и Y точно связаны линейной функциональной зависимостью;
4) если , то между X и Y нет линейной корреляционной зависимости, но это не исключает существования другого вида зависимости;
5) если , то имеет место прямая корреляционная зависимость;
6) если , то имеет место обратная корреляционная зависимость.
На рисунках отражен геометрический смысл коэффициента корреляции. На рисунках а и б случайные величины X, У коррелированы (r > 0 или r < 0), на рисунках в и г — некоррелированы (r = 0). Если r = 0, случайные величины могут быть как зависимыми (см. рис. в), так и независимыми(см. рис. г).
Выборочный коэффициент корреляции является случайной величиной.
Проверка гипотезы о корреляции случайных величин. Пусть по данным выборки объема п получен выборочный коэффициент корреляции r ¹ 0. Требуется проверить гипотезу о равенстве нулю истинного значения коэффициента корреляции r, т.е,
Статистика определяется по формуле
.
Граничная точка определяется с помощью функции пакета Exel: СТЬЮДРАСПОБР(1− p; n−2).