Регрессионный анализ

 

До сих пор мы пользовались МНК как вычисли­тельным приемом. Нам нигде не приходилось вспоминать о статистике. Но, как только мы начинаем про­верять какие-либо гипотезы о пригодности модели или о значимости коэффициентов, приходится вспоминать о статистике. И с этого момента МНК превращается в рег­рессионный анализ.

А регрессионный анализ как всякий статистический метод, применим при определенных предположениях, постулатах.

Первый постулат. Параметр оптимизации y есть случайная величина с нормальным законом распределения. Дисперсия воспроизводимости – одна из харак­теристик этого закона распределения.

В данном случае, как и по отношению к любым другим постулатам, нас интересуют два вопроса: как проверить его выполнимость и к чему приводят его нарушения?

При наличии большого экспериментального материала (десятки параллельных опытов) гипотезу о нормальном рас­пределении можно проверить стандартными статистичес­кими тестами (например, – критерием). К сожалению, экспериментатор редко располагает такими данными, поэтому приходится принимать этот постулат на веру.

При нарушении нормальности мы лишаемся возмож­ности установления вероятностей, с которыми справедливы те или иные высказывания. В этом таится большая опас­ность. Мы рискуем загипнотизировать себя численными оценками и вероятностями, за которыми ничего не стоит. Вот почему надо очень внима­тельно относиться к возможным нарушениям предпосылок.

Второй постулат. Дисперсия y не зависит от абсо­лютной величины y. Выполнимость этого постулата проверяется с помощью критериев однородности дисперсий в разных точках фак­торного пространства. Нарушение этого постулата недо­пустимо.

Всегда существует та­кое преобразование y,которое делает дисперсии одно­родными. Увы, его не всегда легко найти. Довольно часто помогает логарифмическое преобразование, с которого обычно начинают поиски.

Третий постулат. Значения факторов суть неслу­чайные величины. Это несколько неожиданное утверждение практически означает, что установление каждого фактора на заданный уровень и его поддержание существенно точнее, чем сшибка воспроизводимости.

Нарушение этого постулата приводит к трудностям при реализации матрицы планирования. Поэтому оно обычно легко обнаруживается экспериментатором.

Существует еще четвертый постулат, налагающий ог­раничения на взаимосвязь между значениями факторов. У Нас он выполняется автоматически в силу ортогональ­ности матрицы планирования.