Ковариация и корреляция

 

В естественных науках важной задачей является анализ зависимостей между изучаемыми величинами. При обработке и использовании статистических данных с целью получения как научных, так и практических выводов вызывает интерес, как изменяется один признак при изменении другого. Эти зависимости могут быть функциональными, стохастическими. В функциональных зависимостях каждому значению одной переменной соответствует единственное значение другой, т. е. результативный признак полностью определяется факторным. Стохастической называется зависимость, при которой изменение одной из величин влечет изменение распределения другой. Факторный признак в таких связях не полностью определяет результативный признак, а влияет только на среднее значение, при этом отдельные результаты могут противоречить установленной связи.

В статистике изучаются наблюденные данные случайных величин, поэтому стохастическая зависимость называется статистической, или корреляционной.

Задачами корреляционного анализа являются:

· измерение степени связи;

· отбор факторов, оказывающих наибольшее влияние на результативный признак на основании степени связности между признаками;

· обнаружение неизвестных причинных связей.

Для оценки тесноты и вида связи между случайными величинами используются показатели ковариации и корреляции.

Пусть , , …, – выборка из генеральной совокупности двумерной случайной величины , описывающей случайный эксперимент.

Выборочной ковариацией называется среднее произведений отклонений значений выборок и от их средних , : .

Ковариация характеризует рассеивание значений выборок и , а также линейную связь между ними.

Выборочной ковариационной матрицей называется матрица вида

.

Очевидно, что = , = , где для оценки , используют исправленные выборочные дисперсии , .

Выборочная ковариационная матрица устанавливает взаимосвязь между выборками и из генеральных совокупностей:

· при большим значениям выборки соответствуют большие значения выборки ;

· при большим значениям выборки соответствуют меньшие значения выборки ;

· при данные выборок и не связаны.

Выборочным коэффициентом корреляции rXY случайных величин X и Y, между которыми предполагается линейная корреляционная связь, называется величина, определяемая по формуле

.

Качественная оценка тесноты связи между величинами выявляется по шкале Чеддока (табл. 6)

Таблица 6. Шкала Чеддока

Теснота связи Значение коэффициента корреляции при наличии
прямой связи обратной связи
Слабая 0,1–0,3 (–0,1)–(–0,3)
Умеренная 0,3–0,5 (–0,3)–(–0,5)
Заметная 0,5–0,7 (–0,5)–(–0,7)
Высокая 0,7–0,9 (–0,7)–(–0,9)
Весьма высокая 0,9–0,99 (–0,9)–(–0,99)

 

Выборочной корреляционной матрицей называется матрица вида .

Выборочная корреляционная матрица также устанавливает взаимосвязь наборов выборочных данных по величине:

1) при большим значениям выборки Х соответствуют большие значения выборки Y;

2) при большим значениям выборки Х соответствуют меньшие значения выборки Y (или наоборот);

3) при данные двух диапазонов некоррелированы;

4) при существует линейная функциональная зависимость между выборочными значениями Х и Y.

При исследовании связи между несколькими случайными величии-нами находятся выборочные коэффициенты ковариации и корреляции между парами всех исследуемых величин и строятся соответ-ствующие ковариационные и корреляционные матрицы.

Тест 9.1. В формуле для вычисления коэффициента линейной корреляции вместо «?» надо поставить:

1) ;

2) ;

3) , ;

4) 1, ;

5) 0, .

Тест 9.2.Если признаки , независимы, то коэффициент корреляции равен:

1) ;

2) ;

3) ;

4) ;

5) .

Тест 9.3. Коэффициент корреляции rxy = –1, тогда связь между признаками:

1) прямая;

2) обратная линейная;

3) XY независимы;

4) прямая линейная.

Тест 9.4. Если признаки X и Y линейно зависимы, причем наблюдается прямая зависимость, то:

1) ;

2) ;

3) ;

4) ;

5) .