Оценка адекватности и точности трендовых моделей
Независимо от вида и способа построения экономико-математической модели вопрос о возможности ее применения в целях анализа и прогнозирования экономического явления может быть решен только после установления адекватности, т.е. соответствия модели исследуемому процессу или объекту. Так как полного соответствия модели реальному процессу или объекту быть не может, адекватность — в какой-то мере условное понятие. При моделировании имеется в виду адекватность не вообще, а по тем свойствам модели, которые считаются существенными для исследования.
Трендовая модель конкретного временного ряда считается адекватной, если остаточная компонента удовлетворяет следующим свойствам:
• случайностью колебаний уровней остаточной последовательности;
• соответствием распределения случайной компоненты нормальному закону распределения;
• равенством математического ожидания случайной компоненты нулю;
• независимостью значений уровней случайной последовательности, то есть отсутствием существенной автокорреляции.
Рассмотрим, каким образом осуществляется проверка этих свойств остаточной последовательности.
Проверка случайности колебаний уровней остаточной последовательностиозначает проверку гипотезы о правильности выбора вида тренда. Для исследования случайности отклонений от тренда мы располагаем набором разностей:
Характер этих отклонений изучается с помощью ряда непараметрических критериев. Одним из таких критериев является критерий серий, основанный на медиане выборки. Ряд из величин располагают в порядке возрастания их значений и находят медиану полученного вариационного ряда, т.е. срединное значение при нечетном n или среднюю арифметическую из двух срединных значений при n четном. Возвращаясь к исходной последовательности и сравнивая значения этой последовательности с , будем ставить знак «плюс», если значение превосходит медиану, и знак «минус», если оно меньше медианы; в случае равенства сравниваемых величин соответствующее значение опускается. Таким образом, получается последовательность, состоящая из плюсов и минусов, общее число которых не превосходит n. Последовательность подряд идущих плюсов или минусов называется серией. Для того чтобы последовательность была случайной выборкой, протяженность самой длинной серии не должна быть слишком большой, а общее число серий — слишком малым.
Обозначим протяженность самой длинной серии через , а общее число серий —через . Выборка признается случайной, если выполняются следующие неравенства для 5%-ного уровня значимости:
где квадратные скобки, как обычно, означают целую часть числа.
Если хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере отклонений уровней временного ряда от тренда отвергается и, следовательно, трендовая модель признается неадекватной.
Другим критерием для данной проверки может служить критерий пиков (поворотных точек, максимумов). Уровень последовательности считается максимумом, если он больше двух рядом стоящих уровней, т.е. , и минимумом, если он меньше обоих соседних уровней, т.е. . В обоих случаях считается поворотной точкой. Общее число поворотных точек для остаточной последовательности обозначим через .
В случайной выборке математическое ожидание числа точек поворота и дисперсия выражаются формулами:
Критерием случайности с 5% -ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства:
(5.9)
где квадратные скобки, как и ранее, означают целую часть числа.
Если это неравенство нарушается, то гипотеза о случайном характере отклонений уровней временного ряда от тренда отвергается и, следовательно, трендовая модель признается неадекватной.
Проверка соответствия распределения случайной компоненты нормальному закону распределенияможет быть произведена лишь приближенно с помощью исследования показателей асимметрии и эксцесса ( ),так как временные ряды, как правило, не очень велики. При нормальном распределении показатели асимметрии и эксцесса некоторой генеральной совокупности равны нулю. Мы предполагаем, что отклонения от тренда представляют собой выборку из генеральной совокупности, поэтому можно определить только выборочные характеристики асимметрии и эксцесса и их ошибки:
В этих формулах выборочная характеристика асимметрии; выборочная характеристика эксцесса; и соответствующие среднеквадратические ошибки.
Если одновременно выполняются следующие неравенства:
то гипотеза о нормальном характере распределения случайной компоненты принимается.
Если выполняется хотя бы одно из неравенств:
то гипотеза о нормальном характере распределения отвергается, трендовая модель признается неадекватной. Другие случаи требуют дополнительной проверки с помощью более сложных критериев.
Кроме рассмотренного метода известен ряд других методов проверки нормальности закона распределения случайной величины: метод Вестергарда, RS-критерий и т. д. Рассмотрим наиболее простой из них, основанный на RS-критерии. Этот критерий численно равен отношению размаха вариации случайной величины R к стандартному отклонению S.
В нашем случае , а .
Вычисленное значение RS-критерия сравнивается с табличными (критическими) нижней и верхней границами данного отношения, и если это значение не попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о нормальности распределения отвергается; в противном случае эта гипотеза принимается. Для иллюстрации приведем несколько пар значений критических границ RS-критерия для уровня значимости : при нижняя граница равна 2,67, а верхняя равна 3,685; при эти числа составляют соответственно 3,18 и 4,49; при они равны 3,47 и 4,89.
Проверка равенства математического ожидания случайной компоненты нулю,если она распределена по нормальному закону, осуществляется на основе критерия Стьюдента. Расчетное значение этого критерия задается формулой
, ()
где среднее арифметическое значение уровней остаточной последовательности ;
стандартное (среднеквадратическое) отклонение для этой последовательности и рассчитывается по формуле:
Если расчетное значение t меньше табличного значения статистики Стьюдента с заданным уровнем значимости а и числом степеней свободы , то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается; в противном случае эта гипотеза отвергается и модель считается неадекватной.
Проверка независимости значений уровней случайной компоненты,т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона. Расчетное значение этого критерия определяется по формуле
()
Заметим, что расчетное значение критерия Дарбина-Уотсона в интервале от 2 до 4 свидетельствует об отрицательной связи; в этом случае его надо преобразовать по формуле ив дальнейшем использовать значение .
Расчетное значение критерия d (или d') сравнивается с верхним и нижним критическими значениями статистики Дарбина—Уотсона, фрагмент табличных значений которых для различного числа уровней ряда п и числа определяемых параметров модели k представлен для наглядности в табл. 5.2 (уровень значимости 5%).
1,08 1,20 1,35 | 1,36 1,41 1,49 | 0,95 1,10 1,28 | 1,54 1,54 1,57 | 0,82 1,00 1,21 | 1,75 1,68 1,65 |
Если расчетное значение критерия d больше верхнего табличного значения ,то гипотеза о независимости уровней остаточной последовательности, т.е. об отсутствии в ней автокорреляции, принимается. Если значение d меньше нижнего табличного значения ,то эта гипотеза отвергается и модель неадекватна. Если значение d находится между значениями и ,включая сами эти значения, то считается, что нет достаточных оснований сделать тот или иной вывод и необходимы дальнейшие исследования, например, по большему числу наблюдений.
Вывод об адекватности трендовой модели делается, если все указанные выше четыре проверки свойств остаточной последовательности дают положительный результат.
Для адекватных моделей имеет смысл ставить задачу оценки их точности. Точность модели характеризуется величиной отклонения модельных значении уровней от фактических значении.
В качестве статистических показателей точности применяются следующие:
среднеквадратическое отклонение
, (5.13)
средняя относительная ошибка аппроксимации
, (5.14)
коэффициент сходимости
, (5.15)
коэффициент детерминации
и другие показатели; в приведенных формулах количество уровней ряда, число определяемых параметров модели, оценка уровней ряда по модели, среднее арифметическое значение уровней ряда.
На основании указанных показателей можно сделать выбор из нескольких адекватных трендовых моделей экономической динамики наиболее точной, хотя может встретиться случай, когда по некоторому показателю более точна одна модель, а по другому — другая.
Данные показатели точности моделей рассчитываются на основе всех уровней временного ряда и поэтому отражают лишь точность аппроксимации. Для оценки прогнозных свойств модели целесообразно использовать так называемый ретроспективный прогноз — подход, основанный на выделении участка из ряда последних уровней исходного временного ряда в количестве, допустим, уровней в качестве проверочного, а саму трендовую модель в этом случае следует строить по первым точкам, количество которых будет равно . Тогда для расчета показателей точности модели по ретроспективному прогнозу применяются те же формулы, но суммирование в них будет вестись не по всем наблюдениям, а лишь по последним газ наблюдениям. Например, формула для среднего квадратического отклонения будет иметь вид:
,
где значения уровней ряда по модели, построенной для первых уровней.
Оценивание прогнозных свойств модели на ретроспективном участке весьма полезно, особенно при сопоставлении различных моделей прогнозирования из числа адекватных. Однако надо помнить, что оценки ретро прогноза — лишь приближенная мера точности прогноза и модели в целом, так как прогноз на период упреждения делается по модели, построенной по всем уровням ряда.