Решение.

1) Построение поля корреляции:

у
х

2) Построение и анализ линейной модели регрессии:

Для расчета параметров a и b линейной регрессии y = a + b x, в соответствии с методом наименьших квадратов,необходимо решить систему нормальных уравнений относительно a и b:

Из этой системы получаются следующие формулы:

 

b= ; (1)

 

а= (2)

 

По исходным данным рассчитываем S y, S x, S y x, S x2, S у2. Для удобства результаты вычислений заносим в таблицу 1:

Таблица 1

  i     yi   xi   yi xi   xi2   yi2   yxi   y - yxi   Ai
               
               
               
               
               
               
               
               
               
               
               
               
               
             
  Сумма                                
  Среднее значение                 *         *  

 

Подставляя полученные средние значения в формулы (1)и (2), находим

b=

а=

Получили следующее уравнение линейной регрессии: y = ___ ____ ∙x.

 

Из уравнения следует, что с увеличением заработной платы на 1 у.е. доля расходов на ________________________ в среднем на ___ % - ных пункта.

 

3) Для оценки тесноты связи изучаемых явлений рассчитаем линейный коэффициент парной корреляции:

 

rxy = =

 

Полученное значение rxy показывает, что связь ______________________________________.

 

 

4)

а) Определим коэффициент детерминации R2, который характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака:

 

R2 =rxy2=

 

Значение R2 указывает на то, что вариация результативного признака у на _______ % объясняется вариацией признак - фактора х.

б). Оценку качества полученного уравнения регрессии дает также средняя ошибка аппроксимации Ā.

Для того, чтобы вычислить Ā, произведем следующие расчеты:

подставим в уравнение регрессии фактические значения х и определим теоретические (расчетные) значения ŷх (заполняем 7-ой столбец таблицы 1);

найдем разности y - ŷxi (8-ой столбец таблицы 1) и величины Аi= %(9-й столбец таблицы 1).

Теперь находим

Ā = Σ Ai/n =

 

Как видим, в среднем расчетные значения отклоняются от фактических на __________%, что

 

_______________________________________________________________________________.

 

 

в) Оценим качество уравнения регрессии с помощью F-теста. F-тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.

Рассчитаем фактическое значение F-критерия Фишера:

 

Fфакт =

 

Здесь n – число единиц совокупности; m – число параметров при переменных х.

 

В данной задаче получили FтаблFфакт , что указывает на необходимость принять (отвергнуть) гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения регрессии и показателя тесноты связи.