Ковариация и корреляция. Свойства

При изучении многомерных СВ (случайная величина) важное значение имеют их взаимозависимости и зависимости. Рассмотрим некоторые характеристики зависимости и связи СВ. Остановимся на характеристиках зависимости и взаимозависимости между двумя СВ. (В случае многомерной СВ можно изучать попарную зависимости ее компонент). Взаимозависимость между СВ может быть измерена с помощью коэффициентов ковариации и корреляции.

Коэффициентом ковариации СВ Х и Y называется число, которое вычисляется для дискретных СВ по формуле

Kxy=cov(X,Y)=

А для непрерывных - по формуле

Kxy=cov(X,Y)=

Здесь Pij=P(X=xi, Y=yj) – распределение СВ (X,Y) в дискретном случае, а p(x,y) – ПР СВ (X,Y ) – в непрерывном.

Более удобным для характеризации зависимости (как станет видно из следующей ниже теоремы) является нормированный аналог коэффициента ковариации – коэффициент корреляции, который определяется как

ρXY =

Из определения вытекают следующие свойства коэффициента корреляции:

Теорема 3 (Свойства корреляции).Коэффициент корреляции обладает следующими свойствами:

1) ρ(X,Y ) = ρ(Y ,X);

2) ρ(X,Y )| ≤ 1, или −1 ≤ ρ(X,Y ) ≤ 1;

3) Для независимых СВ X и Y ρ(X,Y ) = 0;

4) ρ(X,Y ) = 1 тогда и только тогда, когда Y = aX + b.

 

Доказательство опускаем.

Приведенные свойства коэффициента корреляции позволяют рассматривать его как меру взаимозависимостиСВ. Действительно, свойство 3) показывает, что коэффициент корреляции независимых СВ минимален по абсолютному значению и равен нулю, а из свойства 4) следует, что он максимален по абсолютному значению и равен единице тогда и только тогда, когда между СВ существует сильная линейная зависимость.

 

11. выборка, вариационный ряд, выборочная медиана.

Набор всех возможных значений наблюдаемой СВ в статистике принято называть генеральной совокупностью. Материалом для статистического анализа являются наблюдения , Х2,..., Хп над элементами генеральной совокупности. Результат х = ( 2,..., хп) п наблюдений над элементами генеральной совокупности называют выборкой объема п из данной генеральной совокупности, или просто выборкой.

 

Пусть имеется выборка х = (х12,... ,хп) из генеральной

совокупности по одному числовому признаку. Упорядоченная в порядке возрастания элементов выборка

x(1), x(2), · · · , x(n) С x(i) x(i+1)

называется вариационным рядом, а ее элементы вариантами, или порядковыми статистиками. При этом минимальный и максимальный члены выборки совпадают соответственно с первым и последним (крайними) членами вариационного ряда: = mini xi = x(1), = maxi xi = x(n).

Выборочной медианой называется значение выборки, делящее ее на две равные части.

По вариационному ряду легко построить выборочные медиану и квантили .

 

 

12. Эмпирическая функция распределения (ЭФР). Связь ФР и ЭФР

Эмпирической или выборочной ф-ей распределения (ЭФР) случайно величины Х называется выборочная вероятность того, что Х ≤ х, определённая для всех допустимых значений переменной х.

ЭФР можно определить по формуле:

ЭФР имеет «ступенчатый» вид, как и ФР дискретной СВ. Таким образом, непрерывная случайная величина приближённо заменяется дискретной.