Методические указания

Парная регрессия - уравнение связи двух переменных у и х:

где y - зависимая переменная (результативный признак);

x - независимая, объясняющая переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: y=a+b×x+ε.

Нелинейные регрессии делятся на два класса: регрессии, нели­нейные относительно включенных в анализ объясняющих перемен­ных, но линейные по оцениваемым параметрам, и регрессии, нели­нейные по оцениваемым параметрам.

Регрессии, нелинейные по объясняющим переменным:

· полиномы разных степеней y=a+b1×x+b2×x2+b3× x3

· равносторонняя гипербола

Регрессии, нелинейные по оцениваемым параметрам:

· степенная y=a× xb×ε

· показательная y=a× bx×ε

· экспоненциальная y=ea+b×x×ε

Построение уравнения регрессии сводится к оценке ее парамет­ров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е.

Для линейных и нелинейных уравнений, приводимых к линей­ным, решается следующая система относительно а и Ь:

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

Тесноту связи изучаемых явлений оценивает линейный коэффи­циент парной корреляции rxy, для линейной регрессии (-1£ rxy£1):

и индекс корреляции ρxy для нелинейной регрессии (0£ ρxy£1):

Оценку качества построенной модели даст коэффициент (ин­декс) детерминации, а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

Допустимый предел значений - не более 8 - 10%.

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от сво­ей средней величины при изменении фактора х на 1% от своего среднего значения:

Задача дисперсионного анализа состоит в анализе дисперсии за­висимой переменной:

где - общая сумма квадратов отклонений;

- сумма квадратов отклонений, обусловленная регрессией

(«объясненная» или «факторная»);

- остаточная сумма квадратов отклонений.

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2:

.

Коэффициент детерминации - квадрат коэффициента или индек­са корреляции.

F-mecm - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но статистической не значимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакг и критического (табличного) Fтабл зна­чений F-критерия Фишера. Fфакт определяется из соотношения зна­чений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

где п — число единиц совокупности;

m - число параметров при переменных x..

Fтабл - это максимально возможное значение критерия под влия­нием случайных факторов при данных степенях свободы и уровне значимости а. Уровень значимости а - вероятность отвергнуть пра­вильную гипотезу при условии, что она верна. Обычно а принимает­ся равной 0,05 или 0,01.

Если Fтабл < Fфакг, то Hо - гипотеза о случайной природе оцени­ваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакг, то гипотеза Hо не от­клоняется и признается статистическая не значимость, ненадежность y уравнения регрессии.

Для оценки статистической значимости коэффициентов рег­рессии и корреляции рассчитываются t-критерий Стьюдента и до­верительные интервалы каждого из показателей. Выдвигается гипо­теза Но о случайной природе показателей, т.е. о незначимом их от­личии от нуля. Оценка значимости коэффициентов регрессии и кор­реляции с помощью меритерия Стьюдента проводится путем сопос­тавления их значений с величиной случайной ошибки:

Случайные ошибки параметров линейной регрессии и коэффици­ента корреляции определяются по формулам:

Сравнивая фактическое и критическое (табличное) значения t-статистики – t-табл и tфакг - принимаем или отвергаем гипотезу Hо

Связь между F-критерием Фишера и f-статистикой Стьюдента выражается равенством

Если tтабл < tфакг, то Но отклоняется, т.е. a, b и rxy не случайно от­личаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт. то гипотеза Но не откло­няется и признается случайная природа формирования а, b или rxy

Для расчета доверительного интервала определяем предельную ошибку Δ для каждого показателя:

Δa=tтаблmа, Δb=tтаблmb,

Формулы для расчета доверительных интервалов имеют сле­дующий вид:

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцени­ваемый параметр принимается нулевым, так как он не может одно­временно принимать и положительное, и отрицательное значения.

Прогнозное значение yp определяется путем подстановки в урав­нение регрессии соответствующего (прогнозного) зна­чения Хр. Вычисляется средняя стандартная ошибка прогноза

 

где

и строится доверительный интервал прогноза:

где