Моделирование временных рядов

Следуя основной идее статистики, при анализе временного ряда его ви­димую изменчивость стараются разделить на закономернуюи случайнуюсоставляющие.

Закономерныеизменения членов временного ряда подчиняются какому-то определенному правилу и поэтому предсказуемы. Эта составля­ющая может быть вычислена в каждый момент времени как некая функция от текущего момента времени. Эта функция может зависеть как от момента времени, так и от ряда других параметров. Когда эти параметры неизвест­ны, приходится оценивать их по имеющимся наблюдениям — как, например, бывает в случае регрессии.

Под закономерной(детерминированной) составляющей временно­го ряда {y1, y2, …, yn} понимается числовая последовательность {d1, d2, ..., dn}, элементы которой вычисляются по определенному правилу как функция времени.

Изменчивость, оставшаяся необъясненной, иррегулярна и хаотична и носит название случайнойкомпоненты. Для ее описания необходим статистический подход. Если мы полностью выявили закономерную состав­ляющую в поведении временного ряда, то оставшаяся часть должна выгля­деть хаотично и непредсказуемо. Ее обычно обозначают в следующем виде: 1, ε2, ..., εп}.

Другими словами, прогноз и моделирование временных рядов включает как этап анализа, или декомпозиции, так и этап синтеза, сборки ряда в единое целое. При проведении этапов анализа и синтеза ничто не должно остаться лишним и непроясненным; если это так, то можно говорить, что с точки зрения статистики о временном ряде нам известно все. К сожалению, в большинстве случаевэтот идеал недостижим.

Остановимся более подробно на этапе анализа временного ряда. Раз­дают аддитивнуюи мультипликативную моделианализа временного ряда. Формы разложения (декомпозиции) временного ряда на детерминированную и случайную составляющие различаются в этих моделях.

Аддитивной моделью временного ряда называется представление ряда в виде суммы детерминированной и случайной компонент, а именно: yt = dt + еt, t = 1,2,..., п.

Мультипликативной моделью временного ряда называется представление ряда в виде произведения детерминированной и случайной компонент, а именно: yt = dt * et, t = 1,2, ..., п.

Если в приведенном соотношении перейти к логарифмам, то получится аддитивная модель, но не для самих yt, а для их логарифмов, т. е. . Это соотношение объясняет распространенность логарифмических шкал при анализе экономических временных рядов.

В рамках детерминированной компоненты определим тренд, сезонную и циклическую компоненты:

• тренд – trt,

• сезонную компоненту – st,

• циклическую компоненту – ct.

Для определенности изложения рассмотрим аддитивную модель временного ряда (хотя это может быть и мультипликативная или какая-либо иная смешанная схема), т. е. возьмем представление вида:

dt = trt + st + ct.

В последнее время к указанным трем компонентам добавляют еще одну компоненту, именуемую интервенцией.

Под интервенцией понимают существенное кратковременное воздействие на временной ряд.

Примером интервенции могут служить события «черного вторника» (11 октября 1994 г. курс доллара за день вырос на 40% с 283 рублей до 392 руб­лей), а также финансовый кризис августа 1998 г., когда курс рубля поотношению к доллару упал втрое.

К наиболее часто используемым моделям тренда относят следующие:

• линейная функция: ,

• парабола: ,

• экспонента: .

Модели сезонной компоненты. Эти модели базируются на использовании гармонического анализа. Так, для полигармонической модели имеем:

Модели случайной компоненты. Опыт пока­зывает, что временной ряд редко удается полностью описать одной лишь детерминированной компонентой. В ней часто присутствует нерегулярная, случайная компонента. Ее поведение нельзя точно предсказать заранее. Для ее описания приходится привлекать понятия из теории вероятностей.

Для описания нерегулярной компоненты и всего временного ряда в це­лом используют понятия случайного (стохастического) процесса или случайной последовательностикак процесса от целочисленного аргумента. Важным классом случайных процессов являются нормальные, или гауссовские, случайные процессы.

Простейшей моделью случайной компоненты временного ряда с точки зрения математики является последовательность независимых случайных величин. Среди них наиболее важные – «белый шум» и «гауссовский белый шум».

Белым шумом называется временной ряд (случайный процесс) с ну­левым средним, если составляющие его случайные величины незави­симы и распределены одинаково.

Гауссовский белый шум — это последовательность независимых нормально распределенных случайных величин с нулевым средним и общей дисперсией.

Прогнозирование

В общем случае к прогнозированию можно подступиться двумя путями.

Первый — попытаться вскрыть причинно-следственный механизм, т. е. найти факторы, определяющие поведение прогнозируемой величины. Этот путь ведет к экономико-математическому моделированию.

Второй — не вдаваясь в механику движения, попытаться предсказать будущее положение, анализируя временной ряд показателя изолированно. Методы прогнозирования существенно различаются в зависимости от того, является ли прогнозирование краткосрочнымили среднесрочным.В первом случае прогноз строится на один-два момента времени (квартал, месяц, неделю и т. п.) и, как правило, оперативен и непрерывен. В боль­шинстве случаев краткосрочного прогнозирования данные берутся за месяц либо за неделю, соответственно прогноз необходимо построить на один-двамесяца или неделю вперед. При среднесрочном прогнозировании данные, как правило, ежегодные, а прогноз необходимо строить на пять-десять лет вперед.

Указанные различия между задачами кратко- и среднесрочного прогно­зирования приводят к необходимости решать их различными методами.

Более подробно остановимся на краткосрочном прогнозировании. В качестве иллюстрации методологии краткосрочного прогнозирования рас­смотрим метод экспоненциального сглаживания.

Традиционным методом прогнозирования будущего значения показате­ля является усреднение прошлых значений. Пусть имеется ряд данных {..., dt-n+i, ..., dt-1, dt}. Возьмем последние п значений, вычислим по ним среднее ut+1, которое будет рассматриваться в качестве прогноза на момент времени t + 1, т. е.

Пример: При п = 3 имеем

Согласно последней формуле вес отдельного наблюдения, равный 1/3, указывает на долю вклада его значения в значение среднего. При этом более свежие данные (dt) имеют тот же вес, что и более старые (dt-1, dt-2). Вместе с тем можно ожидать, что более важное значение будут иметь свежие данные, и поэтому они должны иметь больший вес. Это можно выразить, например, в следующем виде:

Обобщим вышеприведенный пример.

Рассмотрим набор величин {α, α(1 - α), α(1 - α)2, ...}. Чтобы этот набор величин являлся набором весов, необходимо соблюдение условия того, что сумма этих величин равна единице. Считая, что |1 — α| < 1, и используя формулу для суммы геомет­рической прогрессии, убеждаемся, что α + α(1 - α) + α(1 - α)2 + ... = 1.

Используя приведенный набор весовых величин, получаем следующую цепочку:

В итоге получаем искомую формулу прогноза с помощью экспоненци­ального взвешенного среднего:

Экспоненциальное взвешенное среднее имеет ряд преимуществ перед традиционным скользящим средним.

1. Для построения прогноза по экспоненциальному взвешенному средне­му необходимо задать лишь начальную оценку прогноза. Дальнейшее прогнозирование возможно незамедлительно при поступлении свежих данных.

2. В экспоненциально взвешенном среднем значения весов убывают со временем.

3. Для вычисления экспоненциального взвешенного среднего требуются всего два значения: прошлое значение среднего и текущее значение.