Выборочные значения (оценки) ковариации и коэффициента корреляции и их вычисление в Excel.
В эконометрике корреляционный анализ применяется для отбора факторов, оказывающих наибольшее влияние на исследуемый показатель и оценки качества построенных эконометрических моделей.
Если имеются две выборки x=(x1,…, xI) и y=(y1,…, yI ), то можно рассчитать выборочные значения ковариации и корреляции. Ковариация c рассчитывается по формуле
,
а коэффициент корреляции r по формуле
.
В более общем случае, когда имеется матрица данных X, размерностью I наблюдений на J переменных, то выборочная матрица ковариаций CI между наблюдениями рассчитывается так –
CI=XXt .
Выборочная матрица ковариаций CJ между переменными так –
CJ=XtX .
Для вычисления парных ковариаций в Excel используют следующие стандартные функции: COVAR (КОВАР), CORREL (КОРРЕЛ).
COVAR(x, y)
Возвращает выборочную ковариацию между выборками x и y.
CORREL(x, y)
Возвращает выборочный коэффициент корреляции между выборками x и y.
Понятие статистической процедуры оценивания параметров эконометрической модели. Линейные статистические процедуры. Требования к наилучшей статистической процедуре: несмещённость и минимальные дисперсии оценок параметров.
Оценкой вn параметра называют всякую функцию результатов наблюдений над случайной величиной X (иначе — статистику), с помощью которой судят о значениях параметра a.
Статистические проверки параметров регрессии основаны на непроверяемых предпосылках распределения случайной величины. Они носят лишь предварительный характер. После построения уравнения регрессии проводится проверка наличия у оценок тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям: быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.
В отличие от параметра, его оценка г n — величина случайная. «Наилучшая оценка» r n должна обладать наименьшим рассеянием относительно оцениваемого параметра a, например, наименьшей величиной математического ожидания квадрата отклонения оценки от оцениваемого параметра М(r - a)2.
Оценка в n параметра a называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т. е. М(r) = a.
В противном случае оценка называется смещенной.
Если это равенство не выполняется, то оценка г , полученная по разным выборкам, будет в среднем либо завышать значение a (если М(r) > a , либо занижать его (если М(r) < 0). Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.
Оценка в n параметра a называется состоятельной, если она удовлетворяет закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру:
В случае использования состоятельных оценок оправдывается увеличение объема выборки, так как при этом становятся маловероятными значительные ошибки при оценивании. Поэтому практический смысл имеют только состоятельные оценки.
Несмещенная оценка r n параметра a называется эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра a, вычисленных по выборкам одного и того же объема n.
Так как для несмещенной оценки M(r n - a)2есть ее дисперсия , то эффективность является решающим свойством, определяющим качество оценки.
Для нахождения оценок параметров (характеристик) генеральной совокупности используется ряд методов.
Указанные критерии оценок (несмещенность, состоятельность, эффективность) обязательно учитываются при разных способах оценивания.