Метод наименьших квадратов
Для оценки параметров линейной или линеаризованной модели применяется метод наименьших квадратов (МНК). Суть метода состоит в следующем: к реальным данным подбирается функция и её параметры, чтобы разности (отклонения, остатки) между реальными и вычисленными значениями у были минимальны. Но разностей много, поэтому минимизируется сумма квадратов этих разностей:
Рис.3.1. Отклонения реальных у от оценённой функции регрессии.
Как правило, вычисления проводятся на компьютере с использованием различных сервисов и программ. Далее мы рассмотрим технологию МНК, которую использовали при ручном вычислении параметров парной линейной регрессии.
Сумма квадратов остатков, зависящая от параметров a и b
где n – количество измерений. Эта функция достигает минимума в точке, где её частные производные по a и по b равны нулю:
или
an+bSx=Sy
aSx+bSx2=Sxy
Это называется система нормальных уравнений. В ней два уравнения и два неизвестных aи b, а коэффициенты получаются суммированием х, у и т.д. Решать её можно разными способами. В данном случае использован сервис Excel Поиск решения для настройки линейной модели по данным X и Y, представленным в Таблице . Коэффициенты системы нормальных уравнений расположены в виде матрицы (верхние строки), неизвестные a и bзадаются произвольно и умножаются на коэффициенты (нижние строки). В окне Поиска решения задаются: Целевая ячейка – первая сумма, Значение равно 247 (Sy), Изменяя ячейки – aи b, Ограничения: вторая сумма равна 3901 (Sxy). Исходные данные X и Y приведены в Таблице 3.1. результаты расчёта в Таблице 3.2.
Таблица 3.1. Таблица 3.2.
X | Y | X2 | XY |
Суммы 165 |
a | b | |
-4,27 | 1,78 | |
Суммы по строкам | ||
-47,00 | 294,00 | 246,9999 |
-705,00 | 4606,00 |
Теперь можно построить функцию регрессии Y^, сравнить её с Y и использовать для прогноза.
В принципе, МНК с Поиском решения можно использовать непосредственно. Для этого надо задать произвольные коэффициенты a и b, построить по ним функцию Y^ = a + bX, вычислить остатки e = Y – Y^и их квадраты, сумму e2.
В окне Поиска решения установить Целевая ячейка Se2 минимум, Изменяя ячейки a и b, ограничений нет.
Таблица 3.3.
X | Y | Y^ | Остатки e | e2 |
13,545 | -1,545 | 2,388 | ||
15,327 | -0,327 | 0,107 | ||
17,109 | 0,890 | 0,793 | ||
18,890 | -2,890 | 8,357 | ||
20,672 | 3,327 | 11,070 | ||
22,454 | -0,454 | 0,206 | ||
24,236 | 2,763 | 7,637 | ||
26,018 | 1,981 | 3,927 | ||
27,8 | -2,8 | 7,840 | ||
29,581 | 2,418 | 5,847 | ||
31,363 | -3,363 | 11,314 | ||
Суммы | 1E-06 | 59,490 | ||
Дисперсии | 40,872 | 34,923 | 5,949 | |
R2 | 0,854 | a | b | |
F | 52,833 | -4,27 | 1,78 |