Дата занятия: 30 сентября

1. Модель со случайными эффектами: введение

Для моделирования разных стартовых различий при одинаковой взаимосвязи существует альтернатива – модель со случайными эффектами (RE-модель). Спецификация выглядит следующим образом: \[y_{it} = b_{0} + b_{1}*x_{it} + \alpha_{i} + e_{it}\]

В этой модели две составляющие ошибки: те значимые характеристики на уровне стран (неизменяющиеся во времени), которые мы пропускаем, уходят в ошибку \(\alpha_i\), в то время как пропущенные изменяющиеся во времени и по странам характеристики оказываются во второй составляющей ошибки – \(e_{it}\).
Так, теперь различия в стартовых условиях представлены как случайная величина, в FE-модели неоднородность задается как набор параметров. Такая спецификация RE-модели предполагает следующие допущения:

1.\(Cov(\alpha_{i}, e_{it}) = 0\)

2.\(Cov(x_{it}, e_{it}) = 0\)

3.\(Cov(x_{it}, \alpha_{i}) = 0\)

Уже на основе содержательных соображений, исходя из того, с какими данными мы работаем, можно наметить, какая модель c FE или RE нам в большей степени подходит, с какой альтернативой будем работать. Если мы работаем с некоторой специфической выборкой (к примеру, сейчас мы работаем с посткоммунистическими странами, выборку нельзя назвать случайной), то FE-модель нам подойдет больше.

2. Метод оценивания: (F)GLS

Что применять вместо OLS в условиях гетероскедастичности? Альтернатива

Для получения эффективных оценок вместо привычного нам OLS в качестве альтернативы будет использоваться метод оценивания GLS (generalized least squares) – обобщенный метод наименьших квадратов. Если ранее мы исходили их допущения гомоскедастичности и предполагали постоянной условную вариацию ошибку = \(\sigma^2\), то теперь условная вариация ошибки разная для разных пространственных единиц. Так, модель преобразуется таким образом, что каждое наблюдение делится на стандартную ошибку. Такая стандартизация приводит к постоянной дисперсии ошибки, что нам и нужно было.

Пусть матрица \(\Sigma\) – ковариационная матрица ошибок.

Тогда мы находим матрицу P такую, что \(\Sigma^{-1} = P^TP\)

Вместо \(X\) рассматриваем \(PX\), а вместо \(y\) используем \(Py\), подставляем в классическую формулу оценки \(\hat{b}_{OLS}\): \(((PX)^TPX)^{-1}(PX)^TPy = (X^TP^TPX)^{-1}X^TP^TPy\)

Привели к виду, удобоваримому для OLS

Таким образом, в итоге получается следующая формула для расчета оценок коэффициентов: \[\hat{\beta}_{GLS} = (X^T\Sigma^{-1}X)^{-1}X^T\Sigma^{-1}y\].

Сравните с соответствующей оценкой, полученной без применения предварительного преобразования модели: \[\hat{\beta}_{OLS} = (X^TX)^{-1}X^Ty\]

FGLS: “предательское” появление F

И здесь нужно было радоваться: в идеальном мире при применении GLS все было бы хорошо, и мы бы получили в результате оценки с желательными для нас свойствами, в том числе, и эффективные, к чему стремились изначально. Но это в идеальном мире…, если у нас есть истинная ковариационная матрица ошибок. На практике же у нас есть только ее оценка \(\hat{C}\). И здесь GLS превращается в FGLS – feasible generalized least squares, то есть, GLS, реализуемый на практике, доступный для нас.

\[\hat{\beta}_{FGLS} = (X^T\hat{\Sigma}^{-1}X)^{-1}X^T\hat{\Sigma}^{-1}y\].

В таком случае при ограниченной выборке мы ничего точно про свойства оценок \(\hat{\beta}\) сказать не можем. Только асимптотически на оценки FGLS можно опираться: \(\hat{\beta}_{FGLS}\) становится эквивалентной при большом количестве наблюдений \(\hat{\beta}_{GLS}\), и по эффективности выигрывает у \(\hat{\beta}_{OLS}\).

3. FE- VS RE-: формальный тест

Мы уже говорили о содержательных основаниях для выбора подходящей модели. Кроме того, для определения согласованности оценок FE- и RE-моделей существует формальный тест Хаусмана.

Нулевая гипотеза в этом тесте предполагает отсутствие значимых различий между \(b_{FE}\) и \(b_{RE}\): \(b_{FE} = b_{RE}\) В этом случае справедливо: \(cor(x_{it}, \alpha_{i})=0\)

Статистика критерия устроена таким образом, чтобы учесть и разницу между оценками коэффициентов в FE- и RE-модели, и разницу в вариации этих оценок. Выглядит она следующим образом:

\[S = (\hat{\beta}_{FE} - \hat{\beta}_{RE})^T(\hat{C}_{FE}-\hat{C}_{RE})^{-1}(\hat{\beta}_{FE} - \hat{\beta}_{RE})\] Такая статистика при верной нулевой гипотезе имеет распределение \(\chi^2\) с количеством степеней свободы \(k\), где \(k\) – это количество предикторов. Если “перевести” запись в матричном виде: берем квадрат разницы оценок коэффициентов FE- и RE-моделей и делим его на разницу вариаций соответствующих оценок. Получается, что статистика будет иметь высокое значение (нетипичное для нулевой гипотезы), если

  • оценки коэффициентов FE- и RE-моделей несогласованны между собой, наблюдается большая разница между ними, а также
  • при маленькой разнице дисперсий оценок коэффициентов.

Значимое различие между FE- и RE-моделями надо трактовать отнюдь не в пользу RE-модели, так как в условиях альтернативы (нетипичное значение статистики критерия) нарушается предпосылка RE-модели, и случайный эффект и предикторы становятся скоррелированными (привет эндогенности!), что говорит о том, что мы пропустили какие-то значимые факторы на уровне стран. Поэтому при отвержении нулевой гипотезы теста Хаусмана мы отдаем предпочтение FE-модели.

И наоборот, при типичном для \(H_0\) значении статистики критерия оценки коэффициентов FE- и RE-моделей схожи, однако наблюдаются значимые различия в оценках их вариаций. Здесь “проваливается” FE-модель: ее оценки неэффективны, следовательно, при справедливой \(H_0\) выбор отдается в пользу RE-модели.

4. Оценивание RE-модели в R

Посмотрим, какие результаты мы получим, если оценим модель со случайными эффектами. Для этого в model нужно указать тип “random” (ранее для FE-модели с внутригрупповым преобразованием указывали “within”).

panel<-read_dta("C:/Users/User/OneDrive/Рабочий стол/RAPDC_lab1.dta")
re <- plm(fh_polity~state_capacity, data=panel, index=c("country", "period"), model="random")
summary(re)
## Oneway (individual) effect Random Effect Model 
##    (Swamy-Arora's transformation)
## 
## Call:
## plm(formula = fh_polity ~ state_capacity, data = panel, model = "random", 
##     index = c("country", "period"))
## 
## Balanced Panel: n = 27, T = 5, N = 135
## 
## Effects:
##                 var std.dev share
## idiosyncratic 1.167   1.080 0.267
## individual    3.196   1.788 0.733
## theta: 0.7391
## 
## Residuals:
##     Min.  1st Qu.   Median  3rd Qu.     Max. 
## -3.15639 -0.80829  0.32521  0.78980  3.13484 
## 
## Coefficients:
##                Estimate Std. Error z-value  Pr(>|z|)    
## (Intercept)     1.67616    0.69175  2.4231   0.01539 *  
## state_capacity  0.93193    0.11720  7.9513 1.846e-15 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    235.23
## Residual Sum of Squares: 159.44
## R-Squared:      0.3222
## Adj. R-Squared: 0.3171
## Chisq: 63.2232 on 1 DF, p-value: 1.8456e-15

В этой модели мы помимо оценки коэффициента при предикторе получили оценку константы, которая будет показывать стартовое условие – среднее значение уровня демократичности при условии равенства государственной состоятельности 0 – по всей выборке (здесь базовой категории нет).

Когда мы оценивали FE-модель, мы задавались вопросом, а нужна ли нам действительно такая модель, которая учитывает неоднородность, или в целом можно оценить обычную pooled модель. Подобный тест существует и для выбора между RE-моделью и моделью pooled (тест Бреуша–Пагана). Нулевая гипотеза в таком случае о равенстве \(Var(\alpha_{i}) = 0\). Альтернатива исходя из неотрицательных значений вариации правосторонняя.

pooled <- plm(fh_polity~state_capacity, data=panel, model="pooling")
plmtest(pooled, type=c("bp"))
## 
##  Lagrange Multiplier Test - (Breusch-Pagan)
## 
## data:  fh_polity ~ state_capacity
## chisq = 130.3, df = 1, p-value < 2.2e-16
## alternative hypothesis: significant effects

Исходя из результатов теста RE-модель оказывается более предпочтительной по сравнению с моделью pooled.

Реализуем формальный тест для того, чтобы проверить, насколько согласованы результаты FE- и RE-моделей.

fe_country <- plm(fh_polity~state_capacity, data = panel, index=c("country", "period"), effect = "individual", model="within")
phtest(fe_country, re)
## 
##  Hausman Test
## 
## data:  fh_polity ~ state_capacity
## chisq = 5.0183, df = 1, p-value = 0.02508
## alternative hypothesis: one model is inconsistent

Результат в данном случае пограничный, и при выборе разного уровня значимости (одного из конвенциональных: 0.05 или 0.01) будет интерпретироваться по-разному. Результаты теста Хаусмана чувствительны к спецификации модели и размеру выборки. Если ориентироваться на уровень значимости в 0.05, то можно сказать, что FE-модель более предпочтительна. В данном случае уже исходя из содержательных обоснований, так как мы работаем со специфической выборкой посткоммунистических стран, можно было сразу остановиться на FE-модели.