Тест Чоу.

Иногда выборки наблюдений состоят из двух или более подвыборок и необходимо решить вопрос: «сделать для каждой подвыборки отдельное уравнение регрессии или сделать одно общее уравнение регрессии?»

Для подвыборки А:

Для подвыборки В:

Для подвыборки А+В:

Обозначим суммы квадратов остатков для регрессии подвыборок , и , и (сумма квадратов отклонений для регрессии А+В на участке А), и (сумма квадратов отклонений для регрессии А+В на участке В)

Естественно предположить, что , а

Следовательно,

Up – сумма квадратов отклонения для регрессии (А+В). В пределе . Это будет достигаться при совпадении коэффициентов уравнения регрессии (Объединенной регрессии и регрессии подвыборок). Таким образом можно сказать, что имеется уличшение качества уравнения регрессии равное за счет представления уравнения регрессии в виде двух уравнений регрессии.

Однако в этом случае уменьшается число степеней свободы, т.к. в первом случае для объединенной регрессии мы имели число степеней свободы k=n-p-1, где р – число неизвестных.

Если мы берем для двух уравнений регрессии (А+В), то k2=n-2p-2.

Кроме того во втором случае остается необъясненной поэтому необходим критерий, который помог бы однозначно решить вопрос: «эффективно ли улучшение качества уравнения, получаемое за счет использования двух уравнений регрессии, по сравнению с использованием одного уравнения»

Для решения этого вопроса используется тест Чоу, который предполагает вычисления критерия Фишера по формуле:

Где в числителе записано улучшение качества уравнения, деленное на использованные степени свободы, а в знаменателе необъясненная дисперсия результативного признака, деленное на число оставшихся степеней свободы.

Данные расчетные значения критерия Фишера сравнивается при 5% уровне значимости нулевой гипотезы.

Нулевая гипотеза: в ген. Совокупности улучшение качества за счет использования двух уравнений регрессии равно 0.

Табличное значение Fp находится из таблицы со степенями свободы ;

Если Fp меньше Fтабл, то нулевая гипотеза отвергается и считается, что улучшение качества за счет использования двух уравнений регрессии существенно, т.е. имеет смысл их использовать.