Обзор некоторых вопросов и проблем парной регрессии

Базовые понятия теории вероятностей и математической статистики в объеме, необходимом для анализа парных регрессионных моделей, представлены в [3-5].

Все оценки основных показателей парной регрессии приведены нами без доказательств. Строгие выводы их можно найти в [2-4].

Базовые нелинейные модели, используемые в парном эконометрическом моделировании, а также примеры их практического использования описываются в [3]. Здесь же охарактеризованы основные критерии «хорошей модели», которые следует учитывать при построении работоспособной модели и сравнении ее с другими моделями.

Считается, что при построении парной регрессионной модели число наблюдений должно в 7-8 раз превышать число рассчитываемых параметров при переменной x. Это означает, что искать линейную регрессию, имея менее 7 наблюдений, вообще не имеет смысла. Если же вид функции усложняется, то соответственно требуется увеличение числа наблюдений, ибо каждый параметр при x должен рассчитываться хотя бы по 7 наблюдениям. Если, например, мы выбираем параболическую модель , то требуется объем информации, предполагающий уже не менее 14 наблюдений.

Кроме оценки общего качества и статистической значимости, верификация парной линейной регрессионной модели предусматривает проверку модельных предположений (условий 1-5 классической нормальной линейной модели). Некоторые аспекты такой проверки рассматриваются в главе 5. Подробно проблемы тестирования и устранения негативных явлений в парных моделях (гетероскедастичности, автокорреляции и др.) излагаются в [2,3].

Мы рассматриваем оценку тесноты связи между переменными и как один из элементов верификации модели, хотя в ряде случаев ее полезно провести на этапе спецификации. Это связано с тем, что если линейный коэффициент корреляции оказывается недостаточно высоким (линейная связь слабая, умеренная или даже заметная), то уже на ранней стадии эконометрического моделирования следует задуматься о целесообразности выбора парной модели.

Вскрывая взаимосвязи изучаемых процессов, эконометрические модели не решают вопроса о причине этих взаимосвязей. Может оказаться, что совместные изменения переменных вовсе не означают наличия причинных связей между ними. И если это так, то одна из главных целей эконометрики, состоящая в выработке рекомендаций для принятия эффективного решения, не будет достигнута, так как будет неизвестно, на какой фактор надо воздействовать.

Именно потребность в причинном объяснении корреляции и привела американского генетика С.Райта к созданию метода путевого анализа. Путевой анализ основан на изучении всей структуры причинных связей между переменными и заключается в разложении коэффициента парной корреляции на четыре компоненты:

- компоненту прямого влияния (причина u, вызывающая y, задается действием переменной х);

- компоненту косвенного влияния (причина u воздействует на промежуточное звено х и тем самым вызывает у);

- непричинную компоненту, объясняемую наличием общих причин, воздействующих на х и на у;

- непричинную компоненту, зависящую от неанализируемой в модели корреляции.

Методика путевого анализа описана в [2].

О значимости коэффициентов линейной регрессии можно судить не только на основании критерия Стьюдента, но также и по значениям показателя Р-значение из таблицы «Дисперсионный анализ», рассчитанной в режиме работы инструмента "Регрессия" в MS Еxcel. Коэффициенты признаются значимыми, если Р-значение меньше заданного уровня значимости α=0,05. Это же касается и оценки значимости коэффициента детерминации.