Пример 5

Обратимся к данным о совокупном располагаемом доходе и совокупных личных расходах на местный транспорт в США за период с 1970 по 1983 год. Данные представлены как в текущих долларах США, так и в долларах 1972 года - пересчет к последним выполнен с учетом динамики индекса потребительских цен в указанном периоде. (Уровень цен в 1972 г. принят за 100%.)

 

Год Распол. Доход номинал. Расходы номинал. Распол. Доход дефлир. Расходы дефлир.
695.2 3.1 751.6 3.4
751.9 3.3 779.2 3.4
810.3 3.4 810.3 3.4
914.0 3.6 864.7 3.4
998.1 4.0 857.5 3.5
1096.2 4.4 874.5 3.5
1194.3 4.7 906.4 3.6
1313.5 5.0 942.9 3.6
1474.3 5.5 988.8 3.7
1650.5 6.2 1015.7 3.8
1828.7 6.3 1021.6 3.5
2040.9 6.2 1049.3 3.2
2180.1 6.6 1058.3 3.2
2333.2 6.6 1095.4 3.1

 

Диаграммa рассеяния для недефлированных величин имеет вид

 


 

Соответствующая модель линейной связи: Коэффициент детерминации равен . Диаграмме рассеяния дефлированных величин

 

 

соответствует модель линейной связи Коэффициент детерминации равен на этот раз всего лишь .

В связи с последним примером, вернемся к примеру 3 и выясним, не является ли обнаруженная там сильная линейная связь между совокупным располагаемым доходом и совокупными расходами на личное потребление лишь следствием использования недефлированных величин.

Для этого рассмотрим дефлированные значения, представленные следующей таблицей, в последнем столбце которой приведены значения индекса потребительских цен (уровень цен 1972 г. принят за 100%).

 


 

Год Дефлир. доход Дефлир. потребл.
695.2 621.7
751.9 672.4
810.3 737.1
914.0 811.7
998.1 887.9
1096.2 976.6
1194.3 1084.0
1313.5 1204.0
1474.3 1346.7
1650.5 1506.4

 

Соответствующая этой таблице диаграмма рассеяния имеет вид

 

 

Подобранная модель линейной связи Коэффициент детерминации при переходе от номинальных величин к дефлированным остается очень высоким: . Следовательно, наличие сильной линейной связи между совокупным располагаемым доходом и совокупными расходами на личное потребление не является только лишь следствием инфляционных процессов.

Вопрос 5. Что обозначает и как рассчитывается функция эластичности в линейной эконометрической модели ?

Ответ

В модели функция эластичности имеет вид


 

и при возрастает от до с возрастанием значений от до . Если , то . При функция эластичности убывает от до , когда изменяется от до .

К линейной форме связи можно привести и некоторые другие виды зависимости, характерные для экономических моделей.

Вопрос 6. Что мы подразумеваем под свойствами линейной модели , если считаем, что ошибки - случайные величины?

Ответ

Базовая, и наиболее простая модель для последовательности предполагает, что независимые случайные величины, имеющие одинаковое распределение(i. i. d. — independent, identically distributed random variables).

Для нас (пока!) достаточно представлять случайную величину как переменную величину, такую, что до наблюдения ее значения невозможно предсказать это значение абсолютно точно, и, в то же время, для любого , , определена вероятность

того, что наблюдаемое значение переменной не превзойдет ; . Функция , называется функцией распределенияслучайной величины (c. d. f. — cumulative distribution function).

Говоря об ошибках как о случайных величинах, мы, Соответственно, понимаем указанную линейную модель наблюдений таким образом, что

а) существует (теоретическая, объективная или в виде тенденции) линейная зависимость значений переменной от значений переменной с вполне определенными, хотя обычно и не известными исследователю, значениями параметров и ;

б) эта линейная связь для реальных статистических данных не является строгой: наблюдаемые значения переменной отклоняются от значений , указываемых моделью линейной связи

в) при заданных (известных) значениях конкретные значения отклонений

не могут быть точно предсказаны до наблюдения значений даже если значения параметров и известны точно;

г) для каждого , определена вероятность того, что наблюдаемое значение отклонения не превзойдет , причем эта вероятность не зависит от номера наблюдения;

д) вероятность того, что наблюдаемое значение отклонения в i-м наблюдениине превзойдет , не зависит от того, какие именно значения принимают отклонения в остальных наблюдениях.

 

 

Вопрос 7. В каких пределах будет заключена случайная ошибка с вероятностью 0.95, если она имеет Гауссовское распределение с параметром ?

Ответ

Итак, предположив, что в модели наблюдений

 

 

ошибки независимые случайные величины, имеющие одинаковое распределение (i. i. d),мы должны сделать и предположение о том, каким именно является этораспределение.

Классические методы статистического анализа линейных моделей наблюдений предполагают, что таковым является распределение Гаусса (Gaussian distribution), функция плотности которого имеет вид

 

 

График указанной функции плотности имеет колоколообразную форму

 

 

Параметр характеризует степень рассредоточения распределения вдоль оси абсцисс. На диаграмме представлены графики функций плотности гауссовского распределения при трех различных значениях параметра . Из трех представленных функций наибольшее значение в нуле имеет функция плотности с , наименьшее — функция плотности с , а промежуточное между ними — функция плотности с . Эти значения равны, Соответственно,

 

 


Гауссовское распределение симметрично относительно нуля, и это предполагает, что положительные ошибки столь же вероятны, как и отрицательные; при этом, малые ошибки встречаются чаще, чем большие. Если случайная ошибка имеет гауссовское распределение с параметром , то с вероятностью ее значение будет заключено в пределах от до . Соответственно, для трех рассмотренных случаев получаем: с вероятностью значение случайной ошибки заключено в интервале

return false">ссылка скрыта

— при , - при , - при .

Хотя гауссовское распределение довольно часто вполне приемлемо для описания случайных ошибок в моделях наблюдений, оно вовсе не является универсальным. Такое распределение характерно для ситуаций, когда результирующая ошибка является следствием сложения большого количества независимых случайных ошибок, каждая из которых достаточно мала.

 

Вопрос 8. При каких значениях статистики Фишера нулевая гипотеза отвергается, и какова вероятность того, что мы отвергнем верную гипотезу?

Ответ

Применение критериев, основанных на статистиках, имеющих при нулевой гипотезе -распределение Фишера (F-критерии), отнюдь не ограничивается только что рассмотренным анализом статистической значимости регрессии. Такие критерии широко применяются в процессе подбора модели.

Пусть мы находимся в рамках множественной линейной модели регрессии

 

 


c объясняющими переменными, и гипотеза состоит в том, что в модели последние коэффициентов равны нулю, т. е.

 

 

Тогда при гипотезе (т. е. в случае, когда она верна) мы имеем редуцированную модель

 

 

уже с объясняющими переменными.

Пусть - остаточная сумма квадратов в полной модели , а — остаточная сумма квадратов в редуцированной модели . Если гипотеза верна и выполнены стандартные предположения о модели (в частности, ~i. i. d. ), то тогда F-статистика

 

 

рассматриваемая как случайная величина, имеет при гипотезе H0 (т. е.когда действительно q p = q p-1= ¼= q p-q+1= 0) F-распределение Фишера F (q, n-p) с q и (n-p) степенями свободы.

В рассмотренном ранее случае проверки значимости регрессии в целом мы имели , и при этом там имело равенство которое не выполняется в общем случае.

Пусть — сумма квадратов, объясняемая полной моделью ,

— сумма квадратов, объясняемая редуцированной моделью .

Тогда

 

 

так что -статистику можно записать в виде

 

 

из которого следует, что F-статистика измеряет, в Соответствующем масштабе, возрастание объясненной суммы квадратов вследствие включения в модель дополнительного количества объясняющих переменных.

Естественно считать, что включение дополнительных переменных существенно, если указанное возрастание объясненной суммы квадратов достаточно велико. Это приводит нас к критерию проверки гипотезы

 

основанному на F-статистике

 

 

и отвергающему гипотезу , когда наблюдаемое значение этой статистики удовлетворяет неравенству

 


где — выбранный уровень значимости критерия (вероятность ошибки 1-го рода).

Вопрос 9. Какая из трех нулевых гипотезе , , является простой, а какая – сложной?.

Ответ:

 

является сложной

 

,

гетероскедастичность автокоррелированность детерминация

является простой

 

Вопрос 10. Что такое гетероскедастичность и автокоррелированность ошибок?

Ответ

Неоднородность дисперсий ошибок (гетероскедастичность, heteroscedasticity). Этот вид нарушений стандартных предположений характерен для статистических данных, относящихся к одному моменту времени, но собранных по различным регионам, различным предприятиям, различным социальным группам (данные в сечениях, cross-section data). Неоднородность дисперсий возникает также как результат тех или иных структурных изменений в экономике, например связанных с мировыми экономическими кризисами. Последний пример как раз и иллюстрирует подобную ситуацию: резкое возрастание абсолютных величин остатков в этом примере относится к периоду глобального нефтяного кризиса.

Последствия неоднородности дисперсий ошибок:

· Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются смещенными.

· Построенные доверительные интервалы для не Соответствуют заявленным уровням значимости.

· Вычисленные значения - и - отношений уже нельзя рассматривать как наблюдаемые значения случайных величин, имеющих - и -распределения, Соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений - и - отношений с квантилями указанных - и -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели.

Автокоррелированность (сериальная корреляция) ошибок (autocorrelation, serial correlation). Этот вид нарушений стандартных предположений характерен для статистических данных, развернутых во времени (продольные данные, longitudial data). Автокоррелированность ошибок обычно возникает вследствие направильной спецификации модели, например, при невключении в модель существенной объясняющей переменной с выраженной автокорреляцией.

Последствия автокоррелированности ошибок:

· Оценка дисперсии случайных ошибок смещена вниз в случае положительной и смещена вверх в случае отрицательной автокоррелированности ошибок.

· Оценки дисперсий случайных величин (оценок коэффициентов линейной модели) оказываются заниженными в случае положительной и завышенными в случае отрицательной автокоррелированности ошибок.

· Построенные доверительные интервалы для не Соответствуют заявленным уровням значимости: в случае положительной автокоррелированности ошибок построенные интервалы неоправденно узки, а в случае отрицательной автокоррелированности ошибок неоправданно широки.

· Вычисленные значения - и - отношений нельзя рассматривать как наблюдаемые значения случайных величин, имеющих - и -распределения, Соответствующие стандартным предположениям. Поэтому сравнение вычисленных значений - и - отношений с квантилями указанных - и -распределений может приводить к ошибочным статистическим выводам в отношении гипотез о значениях коэффициентов линейной модели. Вычисленные значения - и - отношений завышены в случае положительной и занижены в случае отрицательной автокоррелированности ошибок.

При обнаружении нарушений стандартных предположений следует либо улучшить спецификацию модели, привлекая подходящие дополнительные объясняющие переменные, либо использовать для оценивания коэффициентов и оценивания дисперсий коэффициентов модели специальные методы оценивания, принимающие во внимание обнаруженные нарушения (далее мы рассмотрим два таких метода: взвешенный метод наименьших квадратов и авторегрессионное преобразование переменных).

Размещено на Allbest.ru