Примеры решения типовых задач
Пример № 1.Анализируется прибыль предприятия Y (млн. ден. ед.) в зависимости от расходов на рекламу X (млн. ден. ед.). По наблюдениям за 9 лет получены следующие данные:
yi | 5,0 | 7,0 | 13,0 | 15,0 | 20,0 | 25,0 | 22,0 | 20,0 | 17,0 |
хi | 0,8 | 1,0 | 1,8 | 2,5 | 4,0 | 5,7 | 4,3 | 5,3 | 3,9 |
1. Построить корреляционное поле. Выдвинуть предположение о характере статистической зависимости между переменными X и Y.
2. Найти параметры линейного уравнения регрессии . Поясните экономический смысл выборочного коэффициента регрессии.
3. Найти коэффициент парной корреляции и оценить тесноту связи на основе таблицы Чеддока.
4. Найти коэффициент детерминации R2.
5. Оценить статистическую значимость уравнения регрессии на уровне 0,05, используя F-статистику.
6. Полученное уравнение регрессии изобразить графически. Сделать вывод о качестве построенной модели.
7. Вычислить прогнозное значение при прогнозном значении x0, составляющем 130% от среднего уровня x.
Решение:
1.Построим корреляционное поле:
Анализ рисунка позволяет сделать предположение о наличии сильной линейной зависимости прибыли предприятия Y от расходов на рекламу X. При этом связь имеет положительную тенденцию, т.е. с увеличением расходов на рекламу увеличивается прибыль предприятия.
2. Найдем параметры линейного уравнения регрессии по формулам:
Рассчитаем сначала средние значения , , и .
№ | yi | хi | хi yi | yi2 | хi2 |
5,0 | 0,8 | 4,0 | 25,0 | 0,6 | |
7,0 | 1,0 | 7,0 | 49,0 | 1,0 | |
13,0 | 1,8 | 23,4 | 169,0 | 3,2 | |
15,0 | 2,5 | 37,5 | 225,0 | 6,3 | |
17,0 | 3,9 | 66,3 | 289,0 | 15,2 | |
20,0 | 4.0 | 80,0 | 400,0 | 16,0 | |
20,0 | 5,3 | 106,0 | 400,0 | 28,1 | |
22,0 | 4,3 | 94,6 | 484,0 | 18,5 | |
25,0 | 5,7 | 142,5 | 625,0 | 32,5 | |
Сумма | 29,3 | 561,3 | 2666,0 | 121,4 | |
Среднее | 3,26 | 62,37 | 296,22 | 13,49 |
млн. ден. ед.
Таким образом, уравнение регрессии:
Выборочный коэффициент регрессии b показывает, что при увеличении расходов на рекламу на 1 млн. ден. ед. прибыль предприятия в среднем увеличивается на 3,55 млн. ден. ед.
3. Найдем коэффициент парной корреляции по формуле:
.
.
Таким образом, линейная связь между переменными X и Y прямая, очень сильная.
4. Коэффициент детерминации:
Таким образом, изменение прибыли предприятия Y на 90% обусловлено изменением расходов на рекламу и на 10% – действием других неучтенных в модели факторов.
5. Оценим статистическую значимость уравнения регрессии, используя F-статистику с 95% надежностью.
С помощью критерия Фишера проверяется нулевая гипотеза о статистической незначимости уравнения регрессии. Конкурирующая гипотеза – уравнение регрессии статистически значимо.
Наблюдаемое значение критерия Фишера вычисляется по формуле:
Найдем табличное значение критерия Фишера, определяется из специальной таблицы (см. приложение 2) с помощью трех чисел: уровня значимости и степеней свободы и :
Видно, что наблюдаемое значение критерия Фишера превосходит табличное. Таким образом, нулевая гипотеза о статистической незначимости уравнения регрессии отклоняется на уровне 0,05 и принимается конкурирующая гипотеза , т.е. признается статистическая значимость уравнения регрессии.
6. Построим линейное уравнение регрессии .
Можно сделать вывод о правомочности применения линейной регрессионной модели. Таким образом, полученное уравнение регрессии может быть использовано при прогнозировании.
7. Вычислим прогнозное значение при прогнозном значении x0, составляющем 130% от среднего уровня x:
млн. ден. ед.
млн. ден. ед.
Пример № 2. Зависимость спроса на товар от его цены характеризуется по 20 наблюдениям уравнением: . Доля остаточной дисперсии в общей составило 18 %.
1. Запишите данное уравнение в виде степенной функции. 2. Определите индекс корреляции. 3. Оцените значимость уравнения регрессии через критерий ( 0,05). Сделайте выводы.
Решение:
1. Преобразуем исходное уравнение к степенному виду:
2.Найдем индекс корреляции:
.
3. Проверим статистическую значимость уравнения регрессии с помощью критерия Фишера на уровне значимости 0,05. Индекс корреляции равен 0,91, тогда индекс детерминации .
Проверяется нулевая гипотеза об отсутствии нелинейной связи между переменными X и Y, т.е. , конкурирующая гипотеза о наличии нелинейной связи между переменными X и Y, т.е. .
Рассчитаем наблюдаемое значение критерия Фишера:
Находим табличное значение критерия Фишера:
Сравним наблюдаемое и табличное значение критерия
Фишера:
Таким образом, нулевая гипотеза об отсутствии связи между переменными X и Y отклоняется на уровне значимости 0,05 и принимается конкурирующая гипотеза , т.е. признается статистическая значимость уравнения регрессии.
Пример № 3.Для изучения рынка жилья в городе по данным о 21 коттедже было построено уравнение множественной регрессии:
Стандартные ошибки параметров уравнения регрессии: , , , .
– расстояние до центра города, км; – полезная площадь объекта, м2; – число этажей в доме, ед.
Множественный коэффициент детерминации: .
Найдите скорректированный коэффициент детерминации. Оцените статистическую значимость параметров уравнения регрессии с помощью критерия Стьюдента на уровне 0,01.
Решение:
1. Найдем скорректированный коэффициент детерминации:
.
2. Оцените статистическую значимость параметров уравнения регрессии с помощью критерия Стьюдента на уровне 0,01.
Проверяется нулевая гипотеза о статистической незначимости, т. е. случайной природе параметров уравнения регрессии, конкурирующая гипотеза о неслучайности параметров уравнения регрессии.
Рассчитаем наблюдаемые значения критерия Стьюдента:
,
,
Найдем табличное значение критерия Стьюдента (см. приложение 4):
Сравним табличное значение критерия Стьюдента с наблюдаемыми значениями. Делаем вывод о статистической значимости параметров , , . Параметр статистически незначим, поэтому переменную необходимо исключить из уравнения регрессии.
Пример № 4.В результате исследования зависимости среднедневной заработной платы Y от среднедушевого прожиточного минимуме в день одного трудоспособного Х по n территориям региона было получено линейное уравнение регрессии . Исследуйте остатки данного уравнения регрессии на гетероскедастичность с помощью теста Голдфельда-Квандта на уровне значимости 0,05, если остаточные суммы квадратов для первой и второй групп соответственно равны и ; число степеней свободы остаточных сумм квадратов равны .
Решение:
Проверяется нулевая гипотеза об отсутствии гетероскедастичности остатков.
Конкурирующая гипотеза – наличие гетероскедастичности остатков.
Наблюдаемое значение критерия Фишера находим по формуле:
Находим табличное значение критерия Фишера:
Сравним наблюдаемое и табличное значение критерия Фишера:
Таким образом, нулевая гипотеза об отсутствии гетероскедастичности остатков отклоняется на уровне значимости 0,05 и принимается конкурирующая гипотеза , т.е. признается гетероскедастичность остатков.
Пример 5.Для линейного уравнения регрессии исследуйте остатки на наличие автокорреляции на уровне значимости 0,01, используя тест Дарбина-Уотсона, если известны значения и ; число наблюдений равно 20.
Решение:
Проверяется нулевая гипотеза об отсутствии автокорреляция. Конкурирующие гипотезы – и соответственно о наличии положительной и отрицательной автокорреляции в остатках.
Рассчитаем критерий Дарбина-Уотсона по формуле:
По таблице критических точек Дарбина Уотсона определим (нижнее) и (верхнее) значения критерия Дарбина-Уотсона для заданного числа наблюдений , числа независимых переменных модели и уровня значимости 0,01: ; (см. приложение 3).
По этим значениям числовой промежуток разобьем на пять отрезков. Вывод о наличии (или отсутствии автокорреляции) делается по правилу:
a. если , то существует положительная автокорреляция; гипотеза отклоняется и с вероятностью принимается гипотеза ;
b. если , то попадаем в так называемую зону неопределенности и не имеем возможности ни опровергнуть, ни принять ни одну из гипотез.
c. если , то нет оснований отклонить нулевую гипотезу: автокорреляция остатков отсутствует;
d. если , то попадаем в так называемую зону неопределенности и не имеем возможности ни опровергнуть, ни принять ни одну из гипотез.
e. если , то существует отрицательная автокорреляция: гипотеза отклоняется и с вероятностью принимается гипотеза .
,
,
,
,
Найденное значение критерия Дарбина-Уотсона попадает в первый интервал ( ). Таким образом, можно сделать вывод о наличии положительной автокорреляции на уровне значимости 0,01.
Пример № 6.В результате анализа динамики объема продаж продукции торгового предприятия за 2000-2013 гг. было выявлено, что модель временного ряда имеет только трендовую составляющую млн. руб. (где t = 1, 2, …, 14). Сделайте точечный и интервальный прогноз объема продаж продукции предприятия в момент (т.е. на 2015 г.), если уровень значимости равен 0,05, остаточная сумма квадратов .
Решение:
Точечный прогноз:
Предельная ошибка прогноза:
= 7,5.
Табличное значение критерия Стьюдента:
Интервальный прогноз:
Таким образом, с вероятностью 0,95 можно утверждать, что в 2015 г. объем продаж продукции будет в диапазоне от 10,0 до 11,4 млн. руб.
Пример № 7.Применив необходимое и достаточное условие идентификации, определите, идентифицировано ли каждое из уравнений модели мультипликатора-акселератора:
где C – расходы на потребление;
R – доход;
I – инвестиции;
t – текущий период;
t-1 – предыдущий период.
Решение:
Модель включает три эндогенные переменные ( , , ) и две предопределенные переменные (две лаговые эндогенные переменные и ).
Проверим необходимое условие идентификации для каждого уравнения модели.
Необходимое условие идентификации (НУИ): – уравнение идентифицируемо; – уравнение неидентифицируемо; – уравнение сверхидентифицируемо.
– число предопределенных переменных, отсутствующих в анализируемом (рассматриваемом) уравнении, но присутствующих в системе; – число эндогенных переменных, которые присутствуют в рассматриваемом уравнении. Предопределенные переменные – это экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные.
Первое уравнение. Уравнение включает в себя две эндогенные переменные ( и ) и не включает одну предопределенную переменную ( ). Таким образом, 1+1=2, т.е. уравнение идентифицируемо.
Второе уравнение. Уравнение включает в себя две эндогенные переменные ( и ) и не включает одну предопределенную переменную ( ). Таким образом, 1+1=2, т.е. уравнение идентифицируемо.
Третье уравнение. Уравнение включает в себя три эндогенные переменные ( , и ) и не включает две предопределенных переменных ( и ). Таким образом, 2+1=3, т.е. уравнение идентифицируемо.
Проверим теперь достаточное условие идентификации для каждого уравнения модели.
Достаточное условие идентификации (ДУИ):
Определитель матрицы, составленный из коэффициентов, отсутствующих в исследуемом уравнении, не равен 0, и ранг этой матрицы не менее числа эндогенных переменных системы без единицы:
(1)
Составим матрицу коэффициентов при переменных рассматриваемой модели:
Первое уравнение | -1 | ||||
Второе уравнение | -1 | ||||
Третье уравнение | -1 |
Первое уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:
Определитель данной матрицы не равен нулю:
Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 > 2 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для первого уравнения выполняется.
Второе уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:
Определитель данной матрицы не равен нулю:
Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 > 2 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для второго уравнения выполняется.
Третье уравнение.Матрица при переменных, которые не входят в уравнение, имеет вид:
Определитель данной матрицы не равен нулю:
Ранг матрица A равен двум, поскольку определитель квадратной матрицы A не равен нулю. Тогда 2 = 3 - 1, т.е. выполняется второе неравенство системы (1). Таким образом, достаточное условие идентификации для третьего уравнения выполняется.
Таким образом, исследуемая система идентифицируема.