Тест Чоу.
Иногда выборки наблюдений состоят из двух или более подвыборок и необходимо решить вопрос: «сделать для каждой подвыборки отдельное уравнение регрессии или сделать одно общее уравнение регрессии?»
Для подвыборки А:
Для подвыборки В:
Для подвыборки А+В:
Обозначим суммы квадратов остатков для регрессии подвыборок , и , и (сумма квадратов отклонений для регрессии А+В на участке А), и (сумма квадратов отклонений для регрессии А+В на участке В)
Естественно предположить, что , а
Следовательно,
Up – сумма квадратов отклонения для регрессии (А+В). В пределе . Это будет достигаться при совпадении коэффициентов уравнения регрессии (Объединенной регрессии и регрессии подвыборок). Таким образом можно сказать, что имеется уличшение качества уравнения регрессии равное за счет представления уравнения регрессии в виде двух уравнений регрессии.
Однако в этом случае уменьшается число степеней свободы, т.к. в первом случае для объединенной регрессии мы имели число степеней свободы k=n-p-1, где р – число неизвестных.
Если мы берем для двух уравнений регрессии (А+В), то k2=n-2p-2.
Кроме того во втором случае остается необъясненной поэтому необходим критерий, который помог бы однозначно решить вопрос: «эффективно ли улучшение качества уравнения, получаемое за счет использования двух уравнений регрессии, по сравнению с использованием одного уравнения»
Для решения этого вопроса используется тест Чоу, который предполагает вычисления критерия Фишера по формуле:
Где в числителе записано улучшение качества уравнения, деленное на использованные степени свободы, а в знаменателе необъясненная дисперсия результативного признака, деленное на число оставшихся степеней свободы.
Данные расчетные значения критерия Фишера сравнивается при 5% уровне значимости нулевой гипотезы.
Нулевая гипотеза: в ген. Совокупности улучшение качества за счет использования двух уравнений регрессии равно 0.
Табличное значение Fp находится из таблицы со степенями свободы ;
Если Fp меньше Fтабл, то нулевая гипотеза отвергается и считается, что улучшение качества за счет использования двух уравнений регрессии существенно, т.е. имеет смысл их использовать.