Примеры решения типовых задач

Пример № 1.Анализируется прибыль предприятия Y (млн. ден. ед.) в зависимости от расходов на рекламу X (млн. ден. ед.). По наблюдениям за 9 лет получены следующие данные:

yi 5,0 7,0 13,0 15,0 20,0 25,0 22,0 20,0 17,0
хi 0,8 1,0 1,8 2,5 4,0 5,7 4,3 5,3 3,9

1. Построить корреляционное поле. Выдвинуть предположение о характере статистической зависимости между переменными X и Y.

2. Найти параметры линейного уравнения регрессии . Поясните экономический смысл выборочного коэффициента регрессии.

3. Найти коэффициент парной корреляции и оценить тесноту связи на основе таблицы Чеддока.

4. Найти коэффициент детерминации R2.

5. Оценить статистическую значимость уравнения регрессии на уровне 0,05, используя F-статистику.

6. Полученное уравнение регрессии изобразить графически. Сделать вывод о качестве построенной модели.

7. Вычислить прогнозное значение при прогнозном значении x0, составляющем 130% от среднего уровня x.

 

Решение:

1.Построим корреляционное поле:

Анализ рисунка позволяет сделать предположение о наличии сильной линейной зависимости прибыли предприятия Y от расходов на рекламу X. При этом связь имеет положительную тенденцию, т.е. с увеличением расходов на рекламу увеличивается прибыль предприятия.

2. Найдем параметры линейного уравнения регрессии по формулам:

Рассчитаем сначала средние значения , , и .

yi хi хi yi yi2 хi2
5,0 0,8 4,0 25,0 0,6
7,0 1,0 7,0 49,0 1,0
13,0 1,8 23,4 169,0 3,2
15,0 2,5 37,5 225,0 6,3
17,0 3,9 66,3 289,0 15,2
20,0 4.0 80,0 400,0 16,0
20,0 5,3 106,0 400,0 28,1
22,0 4,3 94,6 484,0 18,5
25,0 5,7 142,5 625,0 32,5
Сумма 29,3 561,3 2666,0 121,4
Среднее 3,26 62,37 296,22 13,49

 

млн. ден. ед.

Таким образом, уравнение регрессии:

Выборочный коэффициент регрессии b показывает, что при увеличении расходов на рекламу на 1 млн. ден. ед. прибыль предприятия в среднем увеличивается на 3,55 млн. ден. ед.

3. Найдем коэффициент парной корреляции по формуле:

.

.

Таким образом, линейная связь между переменными X и Y прямая, очень сильная.

4. Коэффициент детерминации:

Таким образом, изменение прибыли предприятия Y на 90% обусловлено изменением расходов на рекламу и на 10% – действием других неучтенных в модели факторов.

5. Оценим статистическую значимость уравнения регрессии, используя F-статистику с 95% надежностью.

С помощью критерия Фишера проверяется нулевая гипотеза о статистической незначимости уравнения регрессии. Конкурирующая гипотеза – уравнение регрессии статистически значимо.

Наблюдаемое значение критерия Фишера вычисляется по формуле:

Найдем табличное значение критерия Фишера, определяется из специальной таблицы (см. приложение 2) с помощью трех чисел: уровня значимости и степеней свободы и :

Видно, что наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза , т.е. признается статистическая значимость уравнения регрессии.

6. Построим линейное уравнение регрессии .

 

 

Можно сделать вывод о правомочности применения линейной регрессионной модели. Таким образом, полученное уравнение регрессии может быть использовано при прогнозировании.

7. Вычислим прогнозное значение при прогнозном значении x0, составляющем 130% от среднего уровня x:

млн. ден. ед.

млн. ден. ед.

 

Пример № 2. Зависимость спроса на товар от его цены характеризуется по 20 наблюдениям уравнением: . Доля остаточной дисперсии в общей составило 18 %.

1. Запишите данное уравнение в виде степенной функции. 2. Определите индекс корреляции. 3. Оцените значимость уравнения регрессии через критерий ( 0,05). Сделайте выводы.

Решение:

1. Преобразуем исходное уравнение к степенному виду:

 

2.Найдем индекс корреляции:

 

.

3. Проверим статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости 0,05. Индекс корреляции равен 0,91, тогда индекс детерминации .

Проверяется нулевая гипотеза об отсутствии нелинейной связи между переменными X и Y, т.е. , конкурирующая гипотеза о наличии нелинейной связи между переменными X и Y, т.е. .

Рассчитаем наблюдаемое значение критерия Фишера:

Находим табличное значение критерия Фишера:

Сравним наблюдаемое и табличное значение критерия
Фишера:

Таким образом, нулевая гипотеза об отсутствии связи между переменными X и Y отклоняется на уровне значимости 0,05 и принимается конкурирующая гипотеза , т.е. признается статистическая значимость уравнения регрессии.

 

Пример № 3.Для изучения рынка жилья в городе по данным о 21 коттедже было построено уравнение множественной регрессии:

Стандартные ошибки параметров уравнения регрессии: , , , .

– расстояние до центра города, км; – полезная площадь объекта, м2; – число этажей в доме, ед.

Множественный коэффициент детерминации: .

Найдите скорректированный коэффициент детерминации. Оцените статистическую значимость параметров уравнения регрессии с помощью критерия Стьюдента на уровне 0,01.

Решение:

1. Найдем скорректированный коэффициент детерминации:

.

2. Оцените статистическую значимость параметров уравнения регрессии с помощью критерия Стьюдента на уровне 0,01.

Проверяется нулевая гипотеза о статистической незначимости, т. е. случайной природе параметров уравнения регрессии, конкурирующая гипотеза о неслучайности параметров уравнения регрессии.

Рассчитаем наблюдаемые значения критерия Стьюдента:

,

,

Найдем табличное значение критерия Стьюдента (см. приложение 4):

Сравним табличное значение критерия Стьюдента с наблюдаемыми значениями. Делаем вывод о статистической значимости параметров , , . Параметр статистически незначим, поэтому переменную необходимо исключить из уравнения регрессии.

 

Пример № 4.В результате исследования зависимости среднедневной заработной платы Y от среднедушевого прожиточного минимуме в день одного трудоспособного Х по n территориям региона было получено линейное уравнение регрессии . Исследуйте остатки данного уравнения регрессии на гетероскедастичность с помощью теста Голдфельда-Квандта на уровне значимости 0,05, если остаточные суммы квадратов для первой и второй групп соответственно равны и ; число степеней свободы остаточных сумм квадратов равны .

Решение:

Проверяется нулевая гипотеза об отсутствии гетероскедастичности остатков.

Конкурирующая гипотеза – наличие гетероскедастичности остатков.

Наблюдаемое значение критерия Фишера находим по формуле:

Находим табличное значение критерия Фишера:

Сравним наблюдаемое и табличное значение критерия Фишера:

Таким образом, нулевая гипотеза об отсутствии гетероскедастичности остатков отклоняется на уровне значимости 0,05 и принимается конкурирующая гипотеза , т.е. признается гетероскедастичность остатков.

 

Пример 5.Для линейного уравнения регрессии исследуйте остатки на наличие автокорреляции на уровне значимости 0,01, используя тест Дарбина-Уотсона, если известны значения и ; число наблюдений равно 20.

Решение:

Проверяется нулевая гипотеза об отсутствии автокорреляция. Конкурирующие гипотезы – и соответственно о наличии положительной и отрицательной автокорреляции в остатках.

Рассчитаем критерий Дарбина-Уотсона по формуле:

По таблице критических точек Дарбина Уотсона определим (нижнее) и (верхнее) значения критерия Дарбина-Уотсона для заданного числа наблюдений , числа независимых переменных модели и уровня значимости 0,01: ; (см. приложение 3).

По этим значениям числовой промежуток разобьем на пять отрезков. Вывод о наличии (или отсутствии автокорреляции) делается по правилу:

a. если , то существует положительная автокорреляция; гипотеза отклоняется и с вероятностью принимается гипотеза ;

b. если , то попадаем в так называемую зону неопределенности и не имеем возможности ни опровергнуть, ни принять ни одну из гипотез.

c. если , то нет оснований отклонить нулевую гипотезу: автокорреляция остатков отсутствует;

d. если , то попадаем в так называемую зону неопределенности и не имеем возможности ни опровергнуть, ни принять ни одну из гипотез.

e. если , то существует отрицательная автокорреляция: гипотеза отклоняется и с вероятностью принимается гипотеза .

,

,

,

,

Найденное значение критерия Дарбина-Уотсона попадает в первый интервал ( ). Таким образом, можно сделать вывод о наличии положительной автокорреляции на уровне значимости 0,01.

 

Пример № 6.В результате анализа динамики объема продаж продукции торгового предприятия за 2000-2013 гг. было выявлено, что модель временного ряда имеет только трендовую составляющую млн. руб. (где t = 1, 2, …, 14). Сделайте точечный и интервальный прогноз объема продаж продукции предприятия в момент (т.е. на 2015 г.), если уровень значимости равен 0,05, остаточная сумма квадратов .

Решение:

Точечный прогноз:

Предельная ошибка прогноза:

= 7,5.

Табличное значение критерия Стьюдента:

Интервальный прогноз:

Таким образом, с вероятностью 0,95 можно утверждать, что в 2015 г. объем продаж продукции будет в диапазоне от 10,0 до 11,4 млн. руб.

 

Пример № 7.Применив необходимое и достаточное условие идентификации, определите, идентифицировано ли каждое из уравнений модели мультипликатора-акселератора:

где C – расходы на потребление;

R – доход;

I – инвестиции;

t – текущий период;

t-1 – предыдущий период.

 

Решение:

Модель включает три эндогенные переменные ( , , ) и две предопределенные переменные (две лаговые эндогенные переменные и ).

Проверим необходимое условие идентификации для каждого уравнения модели.

Необходимое условие идентификации (НУИ): – уравнение идентифицируемо; – уравнение неидентифицируемо; – уравнение сверхидентифицируемо.

– число предопределенных переменных, отсутствующих в анализируемом (рассматриваемом) уравнении, но присутствующих в системе; – число эндогенных переменных, которые присутствуют в рассматриваемом уравнении. Предопределенные переменные – это экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные.

Первое уравнение. Уравнение включает в себя две эндогенные переменные ( и ) и не включает одну предопределенную переменную ( ). Таким образом, 1+1=2, т.е. уравнение идентифицируемо.

Второе уравнение. Уравнение включает в себя две эндогенные переменные ( и ) и не включает одну предопределенную переменную ( ). Таким образом, 1+1=2, т.е. уравнение идентифицируемо.

Третье уравнение. Уравнение включает в себя три эндогенные переменные ( , и ) и не включает две предопределенных переменных ( и ). Таким образом, 2+1=3, т.е. уравнение идентифицируемо.

Проверим теперь достаточное условие идентификации для каждого уравнения модели.

Достаточное условие идентификации (ДУИ):

Определитель матрицы, составленный из коэффициентов, отсутствующих в исследуемом уравнении, не равен 0, и ранг этой матрицы не менее числа эндогенных переменных системы без единицы:

(1)

Составим матрицу коэффициентов при переменных рассматриваемой модели:

 
Первое уравнение -1
Второе уравнение -1
Третье уравнение -1

 

Первое уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:

Определитель данной матрицы не равен нулю:

Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 > 2 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для первого уравнения выполняется.

Второе уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:

Определитель данной матрицы не равен нулю:

Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 > 2 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для второго уравнения выполняется.

Третье уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:

Определитель данной матрицы не равен нулю:

Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 = 3 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для третьего уравнения выполняется.

Таким образом, исследуемая система идентифицируема.