Метод максимального правдоподобия

 

Метод максимального правдоподобия позволяет работать при несоблюдении требований теоремы Гаусcа-Маркова, а именно: при наличии гетероскедастичности и несоответствии остатков закону нормального распределения. Метод основан на максимизации совместной вероятности появления реальных значений переменной (в данном случае – остатков) при подборе параметров их функции распределения.

Предварительно приведем пример. Требуется оценить математическое ожидание переменной Х по выборке из двух чисел: X1=X2=6. Можно в качестве оценки использовать среднее значение: μ =Е(Х) = Хср. =(4 + 6) / 2 . Если знать, что закон распределения переменной Х – нормальный с известным стандартным отклонением σ, то можно подобрать Е(Х), максимизирующую функцию

L(X1, X2, μ ) =р(X1, X2, μ)) = р(X1, μ ) * р(X2, μ ) =

Exp(-(X1- μ )2 /(2 σ2)) * Exp(-(X2- μ )2 /(2 σ2))

σ √2π σ√2π

которая называется функцией правдоподобия.

Ее логарифм

l(X1, X2, μ)= ln(L(X1, X2, μ)) = Σ (-(Xi- μ) 2 /2 σ 2 ) – ln(σ) –ln(√2π))

т.е. от произведения мы переходим к сумме. При σ=1, отброшенных константах и различных μ:

μ =4 : l(4,6,4) = - (4-4) 2 - (6-4)2 = - 4

μ=5: l(4,6,5) = - (4-5) 2 - (6-5)2 = - 2

μ=6 : l(4,6,6) = - (4-6) 2 - (6-6)2 = - 4

т.е. максимум функции правдоподобия достигается при μ=5.

При построении эконометрической модели вместо μ происходит оценка аппроксимирующих значений зависимой переменной Y. В случае парной регрессии Ŷ =a+bX, и происходит подбор коэффициентов a и b, обеспечивающих максимизацию функции правдоподобия для совокупностей значений (векторов) Y и Ŷ при заданной функции распределения плотности вероятности их разностей (остатков).

Далее представлено построение парной регрессии двумя методами: МНК и Методом максимального правдоподобия (МНП). Распределение остатков предполагается нормальным с оценкой стандартного отклонения s. Технология МНП аналогична МНК с использованием Поиска решения: задаются произвольные начальные значения a, b, но, кроме того, s, по a, b строится функция Ŷ =a+b X, вычисляются остатки Yi - Ŷi , но затем вычисляются не квадраты остатков, а функции ост2/2s2 + ln s и их сумма, равная -ln(L) . Поиск решения ищет ее минимум, изменяя ячейки a , b и, может быть, s. Квадраты остатков МНП приведены для сравнения: видно, что их сумма меньше, чем для МНК, что говорит о высоком качестве подгонки модели.

Таблица 6.1.

    МНК Метод максимального правдоподобия
  a 6,80     a 6,45    
  b 2,09     b 2,14    
          s 3,53  
X Y Ŷ остатки ост2 Ŷ остатки ост2/2s2 + ln s ост2
8,90 3,10 9,63 8,59 3,41 1,73 11,60
10,99 -2,99 8,95 10,73 -2,73 1,56 7,47
13,09 1,91 3,66 12,87 2,13 1,44 4,53
15,18 2,82 7,95 15,01 2,99 1,62 8,93
17,28 -3,28 10,73 17,15 -3,15 1,66 9,93
19,37 2,63 6,92 19,29 2,71 1,56 7,34
21,46 -3,46 12,00 21,43 -3,43 1,73 11,77
23,56 -6,56 43,01 23,57 -6,57 2,99 43,16
25,65 2,35 5,51 25,71 2,29 1,47 5,25
27,75 -2,75 7,55 27,85 -2,85 1,59 8,11
29,84 5,16 26,61 29,99 5,01 2,27 25,12
31,94 1,06 1,13 32,13 0,87 1,29 0,76
      Σ Σ   Σ Σ Σ
      0,00 143,6   0,00 17,62 124,90

 

Для демонстрации возможностей МНП были проведены расчеты в предположении, что распределение остатков имеет форму равностороннего треугольника с основанием 2s. Отрицательные вероятности заменяются на небольшую положительную величину (здесь 0,1) при помощи функции ЕСЛИ. При работе Поиска решения изменялись a и b, s не изменялась. Полученная сумма квадратов остатков в этом случае аналогична результату МНК. Начальные значения a и bв данном случае требуется задавать достаточно близко к истинным значениям, иначе Поиск решения Рис 6.5.

выдает неверные решения.

Таблица 6.2.

  a 6,66    
  b 2,10   Распределение возмущений - треугольник
  s 8,00        
X Y Ŷ остатки ост2 1-ABS(ост)/s ЕСЛИ( L >0; L ; 0,1)
8,76 3,24 10,48 0,60 0,60    
10,86 -2,86 8,19 0,64 0,64    
12,96 2,04 4,15 0,75 0,75    
15,06 2,94 8,64 0,63 0,63    
17,16 -3,16 9,99 0,60 0,60    
19,26 2,74 7,50 0,66 0,66    
21,36 -3,36 11,29 0,58 0,58    
23,46 -6,46 41,73 0,19 0,19    
25,56 2,44 5,95 0,69 0,69    
27,66 -2,66 7,07 0,67 0,67    
29,76 5,24 27,47 0,34 0,34    
31,86 1,14 1,30 0,86 0,86    
      Σ Σ L L    
      1,27 143,78 0,00 0,00    

 

 

Контрольные вопросы

1. Что такое фиктивные переменные и тест Чоу

2. Фиктивные переменные: определение, назначение, типы

3. Тест Чоу на наличие структурных изменений в регрессионной модели

4. Что такое и где применяется Тобит-анализ

5. Логит, пробит и модели двоичного выбора

6. Что такое и где применяется Метод максимального правдоподобия