Решение
1.Уравнение парной линейной регрессии имеет вид:
ŷх = а + bх,
где ŷх – себестоимость молока, руб./л;
х – средняя продуктивность молока, кг;
а, b – параметры уравнения.
Для определения параметров уравнения а и b составим систему нормальных уравнений. Исходное уравнение последовательно умножим на коэффициенты при неизвестных а и b, и затем каждое уравнение просуммируем:
,
где n – число единиц совокупности.
Для расчетов построим вспомогательную таблицу (табл. 7).
Таблица 7
Сельскохозяйственное предприятие | Себестоимость молока, руб./л | Средняя продуктивность молока, кг | у2 | х2 | ху | ŷх | у- ŷх | |
у | х | |||||||
7,5 | 56,25 | 1477,5 | 6,96 | 0,54 | 7,2 | |||
6,0 | 36,00 | 1008,0 | 6,25 | -0,25 | 4,1 | |||
5,2 | 27,04 | 702,0 | 5,44 | -0,24 | 4,6 | |||
8,3 | 68,89 | 2149,7 | 8,48 | -0,18 | 2,1 | |||
5,8 | 33,64 | 875,8 | 5,83 | -0,03 | 0,5 | |||
6,9 | 47,61 | 1283,4 | 6,69 | 0,21 | 3,1 | |||
7,8 | 60,84 | 1817,4 | 7,84 | -0,04 | 0,5 | |||
7,0 | 49,00 | 1491,0 | 7,35 | -0,35 | 5,0 | |||
5,9 | 34,81 | 867,3 | 5,73 | 0,17 | 2,9 | |||
8,0 | 64,00 | 1872,0 | 7,86 | 0,14 | 1,7 | |||
Сум-ма | 68,4 | 478,09 | 13544,1 | × | × | 31,7 |
Подставим полученные данные в систему уравнений:
Разделим каждый член уравнений на коэффициенты при а (в первом уравнении на 10, во втором на 1925):
Вычтем из второго уравнения первое и найдем параметр b:
0,203 = 8,3b; b = 0,0245.
Подставив значение b в первое уравнение, найдем значение а:
а = 6,84 – 192,3 · 0,0245 = 2,13.
Параметры уравнения регрессии можно определить и по другим формулам, которые вытекают из системы нормальных уравнений:
Уравнение регрессии имеет вид:
ŷх = 2,13 + 0,0245х.
Коэффициент регрессии b = 0,0245 показывает, что при росте средней продуктивности молока на 1 кг себестоимость молока в среднем по данной совокупности хозяйств увеличивается на 2,45 копейки за литр.
2. Оценим качество уравнения с помощью средней ошибки аппроксимации по формуле:
где – ошибка аппроксимации.
Подставляя в уравнение регрессии х, определим теоретические (расчетные) значения ŷх (табл. 7). Найдем величину средней ошибки аппроксимации . Для этого заполним две последние графы табл. 7. Отсюда:
.
В среднем расчетные значения себестоимости молока отклоняются от фактических на 3,17%. Качество уравнения регрессии можно оценить как высокое, так как средняя ошибка аппроксимации меньше допустимого предела (8-10%).
3. Рассчитаем средний коэффициент эластичности по формуле:
где и – средние значения признаков.
Отсюда:
;
;
.
Коэффициент эластичности показывает, что в среднем при росте средней продуктивности молока на 1% себестоимость молока повышается на 0,69 %.
4.Для определения тесноты связи между исследуемыми признаками рассчитаем коэффициент корреляции. Для парной линейной зависимости формула имеет вид:
,
где – средняя сумма произведения признаков;
и – средние квадратические отклонения по х и у.
Данные для расчета коэффициента корреляции представлены в табл. 7 и в пункте 3 решения. Отсюда:
;
;
;
.
Коэффициент корреляции свидетельствует, что связь между признаками очень тесная и прямая. Коэффициент детерминации показывает, что 93,5 %изменений в уровне себестоимости объясняется различной продуктивностью молока.
5.Для проверки статистической значимости (существенности) линейного коэффициента парной корреляции рассчитаем t-критерий Стьюдента по формуле:
Вычисленное tфакт сравним с табличным (критическим) значением tтабл при принятом уровне значимости α = 0,05 и числе степеней свободы ν = n – 2 = 10 – 2 = 8. Табличное значение по таблице распределения Стьюдента равно 2,306.
Фактическое значение критерия больше табличного, что свидетельствует о значимости линейного коэффициента корреляции и существенности связи между себестоимостью и продуктивностью молока.
6.Оценим значимости уравнения регрессии и показателя тесноты связи с помощью F-критерия Фишера. Для этого сравним его фактическое значение Fфакт с табличным Fтабл.
Фактическое значение Fфакт определяется по формуле:
,
В нашем случае:
Табличное значение Fфакт по таблице значений F-критерия Фишера при α = 0,05, k1 = m = 1 и k2 = n – m – 1 = 10 – 1 – 1 = 8 равно 5,32 (m – число параметров при переменной х).
Фактическое значение критерия больше табличного, что свидетельствует о статистической значимости уравнения регрессии в целом и показателя тесноты связи , то есть они статистически надежны и сформировались под неслучайным воздействием фактора х.
7.Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Рассчитаем прогнозное значение себестоимости молока при среднем росте продуктивности молока на 10 %.
Прогнозное значение средней продуктивности молока:
Прогнозное значение себестоимости молока:
ŷр = 2,13 + 0,0245·211,53 = 7,31 руб./л.
Методические указания к задаче 2
Пример
По 30 сельскохозяйственным предприятиям имеются данные о средних значениях и вариации урожайности зерновых, количестве внесенных удобрений и насыщенности севооборота зерновыми, а также о значениях коэффициентов парной корреляции между этими признаками (табл. 8).
Таблица 8
Показатель | Признак | Среднее значение | Среднее квадратическое отклонение (σ) | Линейные коэффициенты парной корреляции |
Урожайность зерновых, ц/га | у | 19,5 | 8,4 | =0,405 =0,33, =0,115 |
Внесено органических удобрений, ц/га | х1 | 25,0 | 3,2 | |
Насыщенность севооборота зерновыми, % | х2 | 13,0 |
Требуется:
1.Построить уравнение множественной линейной регрессии зависимости урожайности зерновых от количества внесенных удобрений и насыщенности севооборота зерновыми.
2.Определить линейный коэффициент множественной корреляции.
3.Рассчитать общий F-критерий Фишера при уровне значимости α = 0,05.