Статистические данные и стохастическая модель.
Эконометрическая модель.Введение случайного компонента в экономическую модель приводит к тому, что взаимосвязь остальных ее переменных перестает быть строго детерминированной и становится стохастической, что и наблюдается в реальной действительности. Это отчасти делает модель доступной для эмпирической проверки на основе статистических данных о конкретном экономическом объекте. Если проверка показала адекватность модели, то иногда удается оценить параметры функционирования конкретного экономического объекта и сформулировать рекомендации для принятия практических решений. Работа с эконометрическими моделями требует использования инструментария оценивания и статистической проверки модели ("наука" моделирования), а также решения проблем выбора типа модели, набора объясняющих переменных и вида связей между ними ("искусство" моделирования).
Экономические данные: перекрестные данные (cross-section data) и временные ряды (time series).Статистические данные в эконометрике являются основой для выявления и обоснования эмпирических закономерностей. Без конкретных количественных данных, характеризующих реальное функционирование исследуемого экономического объекта, невозможно определить практическую значимость применяемой экономической модели. Это справедливо даже в том случае, когда целью является выявление преимущественно только качественных закономерностей. Экономические данные обычно делят на два вида: перекрестные или пространственные данные (cross-section data) и временные ряды (time series).
Перекрестные или данные - это набор данных показателей экономических переменных, полученные для разных однотипных объектов (фирм, регионов) примерно в однотипных условиях. При этом либо все данные относятся к одному и тому же моменту времени, либо их времени я принадлежность несущественна. Под пространственной выборкой понимают серию из n независимых наблюдений системы (p+1)-ой независимых величин (X1, X2, …, Xp, Y).
Временные ряды - это упорядоченная выборка наблюдений, характеризующих один и тот же объект, но в различные моменты времени. Здесь важны не только сами наблюдаемые значения, но и порядок следования их друг за другом. Модели временных рядов оказываются обычно сложнее моделей пространственной выборки, так как наблюдения в этом случае нельзя считать независимыми друг от друга.
Данные временных рядов характеризуются определенными зависимостями и закономерностями их последовательных значений, например, могут быть связаны между собой последовательные отклонения от общей тенденции развития; в этих связях экономических показателей могут присутствовать задержки (временные лаги) и т. д. Это обусловливает необходимость специальных методов их обработки и более сложного теоретического анализа по сравнению с данными перекрестных выборок.
Цели и методы сбора статистических данных.Целью сбора экономических данных является получение информационной базы для анализа и принятия решений в условиях появления конкретных проблем. Естественно, что анализ данных и принятие решений проводится на основе какой-либо интуитивной (неявной) или количественной (явной) экономической модели проблемной ситуации. Поэтому собирают именно те данные, которые необходимы для обоснования соответствующей модели.
Существуют различные методы сбора экономических данных: путем опроса, анкетирования и интервьюирования, получения официальной статистической отчетности и т.д. В большинстве стран существуют статистические органы, занимающиеся сбором, обработкой, распространением и публикацией важнейших данных.
Этой деятельностью занимаются также многие специализированные государственные и научные учреждения, а также коммерческие и частные агентства. В Российской Федерации официальными статистическими стандартами являются формы, методы сбора и обработки данных, устанавливаемые Государственным комитетом по статистике.
Подготовка статистических данных и использование их в модели.При подготовке статистических данных для работы с экономической моделью возникают две проблемы. Во-первых, могут отсутствовать необходимые для модели данные. Во-вторых (если все данные есть), нужно правильно отобрать их для конкретной модели так, чтобы они были согласованы и имели общую методическую базу оценки. При отсутствии нужных данных они нередко могут быть рассчитаны по имеющимся данным. Например, если отсутствуют данные о темпе инфляции (INF), но имеются данные о дефляторе валового внутреннего продукта (DEF), то инфляция (по ВВП) может быть рассчитана (в %):
INF = (DEF / DEF-1 - 1 ) 100%
(индекс -1 означает предшествующий год).
Если все нужные данные есть, то для модели необходимо их преобразовать в некоторый взаимно согласованный набор. Если это данные в денежном выражении, то это должны быть всюду одни и те же текущие, либо фиксированные (одного и того же года), денежные единицы. Реальным объемным показателям (то есть в фиксированных ценах) должны соответствовать реальные относительные показатели (например, процентные ставки нужно скорректировать на темп инфляции). В соответствии с решаемой задачей определяют и обобщающие показатели: валовой национальный продукт (ВНП, или GNP), валовой внутренний продукт (ВВП, или GDP), валовые внутренние или национальные сбережения, дефлятор ВНП или ВВП или ряд других. Например, если речь идет о внутреннем производстве и о влиянии на него внутренних инвестиций, то в качестве обобщающего показателя, на который влияют эти инвестиции, должен выступать ВВП, а не ВНП.
3 Модели и методы анализа статистических данных
на основе стационарных временных рядов
Часто экономические показатели, представленные временными рядами, имеют настолько сложную структуру, что моделирование таких рядов путем построения моделей тренда, сезонности и применения других традиционных подходов не приводит к удовлетворительным результатам. Во временном ряду ошибок остаются статистические зависимости, которые можно моделировать.
В последнее время большое внимание уделяется моделированию стационарных временных рядов. Это объясняется тем, что многие временные ряды могут быть приведены к стационарному виду после операции выделения тренда, фильтрации сезонной компоненты или взятия разности. Как правило, ряд ошибок — это стационарный ряд.
Наиболее распространенные модели стационарных рядов это модели авторегрессии и модели скользящего среднего.