Для моделирования разных стартовых различий при одинаковой взаимосвязи существует альтернатива – модель со случайными эффектами (RE-модель). Спецификация выглядит следующим образом: \[y_{it} = b_{0} + b_{1}*x_{it} + \alpha_{i} + e_{it}\]
В этой модели две составляющие ошибки: те значимые характеристики на уровне стран (неизменяющиеся во времени), которые мы пропускаем, уходят в ошибку \(\alpha_i\), в то время как пропущенные изменяющиеся во времени и по странам характеристики оказываются во второй составляющей ошибки – \(e_{it}\).
Так, теперь различия в стартовых условиях представлены как случайная величина, в FE-модели неоднородность задается как набор параметров. Такая спецификация RE-модели предполагает следующие допущения:
1.\(Cov(\alpha_{i}, e_{it}) = 0\)
2.\(Cov(x_{it}, e_{it}) = 0\)
3.\(Cov(x_{it}, \alpha_{i}) = 0\)
Уже на основе содержательных соображений, исходя из того, с какими данными мы работаем, можно наметить, какая модель c FE или RE нам в большей степени подходит, с какой альтернативой будем работать. Если мы работаем с некоторой специфической выборкой (к примеру, сейчас мы работаем с посткоммунистическими странами, выборку нельзя назвать случайной), то FE-модель нам подойдет больше.
Для получения эффективных оценок вместо привычного нам OLS в качестве альтернативы будет использоваться метод оценивания GLS (generalized least squares) – обобщенный метод наименьших квадратов. Если ранее мы исходили их допущения гомоскедастичности и предполагали постоянной условную вариацию ошибку = \(\sigma^2\), то теперь условная вариация ошибки разная для разных пространственных единиц. Так, модель преобразуется таким образом, что каждое наблюдение делится на стандартную ошибку. Такая стандартизация приводит к постоянной дисперсии ошибки, что нам и нужно было.
Пусть матрица \(\Sigma\) – ковариационная матрица ошибок.
Тогда мы находим матрицу P такую, что \(\Sigma^{-1} = P^TP\)
Вместо \(X\) рассматриваем \(PX\), а вместо \(y\) используем \(Py\), подставляем в классическую формулу оценки \(\hat{b}_{OLS}\): \(((PX)^TPX)^{-1}(PX)^TPy = (X^TP^TPX)^{-1}X^TP^TPy\)
Таким образом, в итоге получается следующая формула для расчета оценок коэффициентов: \[\hat{\beta}_{GLS} = (X^T\Sigma^{-1}X)^{-1}X^T\Sigma^{-1}y\].
Сравните с соответствующей оценкой, полученной без применения предварительного преобразования модели: \[\hat{\beta}_{OLS} = (X^TX)^{-1}X^Ty\]
И здесь нужно было радоваться: в идеальном мире при применении GLS все было бы хорошо, и мы бы получили в результате оценки с желательными для нас свойствами, в том числе, и эффективные, к чему стремились изначально. Но это в идеальном мире…, если у нас есть истинная ковариационная матрица ошибок. На практике же у нас есть только ее оценка \(\hat{C}\). И здесь GLS превращается в FGLS – feasible generalized least squares, то есть, GLS, реализуемый на практике, доступный для нас.
\[\hat{\beta}_{FGLS} = (X^T\hat{\Sigma}^{-1}X)^{-1}X^T\hat{\Sigma}^{-1}y\].
В таком случае при ограниченной выборке мы ничего точно про свойства оценок \(\hat{\beta}\) сказать не можем. Только асимптотически на оценки FGLS можно опираться: \(\hat{\beta}_{FGLS}\) становится эквивалентной при большом количестве наблюдений \(\hat{\beta}_{GLS}\), и по эффективности выигрывает у \(\hat{\beta}_{OLS}\).
Мы уже говорили о содержательных основаниях для выбора подходящей модели. Кроме того, для определения согласованности оценок FE- и RE-моделей существует формальный тест Хаусмана.
Нулевая гипотеза в этом тесте предполагает отсутствие значимых различий между \(b_{FE}\) и \(b_{RE}\): \(b_{FE} = b_{RE}\) В этом случае справедливо: \(cor(x_{it}, \alpha_{i})=0\)
Статистика критерия устроена таким образом, чтобы учесть и разницу между оценками коэффициентов в FE- и RE-модели, и разницу в вариации этих оценок. Выглядит она следующим образом:
\[S = (\hat{\beta}_{FE} - \hat{\beta}_{RE})^T(\hat{C}_{FE}-\hat{C}_{RE})^{-1}(\hat{\beta}_{FE} - \hat{\beta}_{RE})\] Такая статистика при верной нулевой гипотезе имеет распределение \(\chi^2\) с количеством степеней свободы \(k\), где \(k\) – это количество предикторов. Если “перевести” запись в матричном виде: берем квадрат разницы оценок коэффициентов FE- и RE-моделей и делим его на разницу вариаций соответствующих оценок. Получается, что статистика будет иметь высокое значение (нетипичное для нулевой гипотезы), если
Значимое различие между FE- и RE-моделями надо трактовать отнюдь не в пользу RE-модели, так как в условиях альтернативы (нетипичное значение статистики критерия) нарушается предпосылка RE-модели, и случайный эффект и предикторы становятся скоррелированными (привет эндогенности!), что говорит о том, что мы пропустили какие-то значимые факторы на уровне стран. Поэтому при отвержении нулевой гипотезы теста Хаусмана мы отдаем предпочтение FE-модели.
И наоборот, при типичном для \(H_0\) значении статистики критерия оценки коэффициентов FE- и RE-моделей схожи, однако наблюдаются значимые различия в оценках их вариаций. Здесь “проваливается” FE-модель: ее оценки неэффективны, следовательно, при справедливой \(H_0\) выбор отдается в пользу RE-модели.
Посмотрим, какие результаты мы получим, если оценим модель со случайными эффектами. Для этого в model нужно указать тип “random” (ранее для FE-модели с внутригрупповым преобразованием указывали “within”).
panel<-read_dta("C:/Users/User/OneDrive/Рабочий стол/RAPDC_lab1.dta")
re <- plm(fh_polity~state_capacity, data=panel, index=c("country", "period"), model="random")
summary(re)
## Oneway (individual) effect Random Effect Model
## (Swamy-Arora's transformation)
##
## Call:
## plm(formula = fh_polity ~ state_capacity, data = panel, model = "random",
## index = c("country", "period"))
##
## Balanced Panel: n = 27, T = 5, N = 135
##
## Effects:
## var std.dev share
## idiosyncratic 1.167 1.080 0.267
## individual 3.196 1.788 0.733
## theta: 0.7391
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -3.15639 -0.80829 0.32521 0.78980 3.13484
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## (Intercept) 1.67616 0.69175 2.4231 0.01539 *
## state_capacity 0.93193 0.11720 7.9513 1.846e-15 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 235.23
## Residual Sum of Squares: 159.44
## R-Squared: 0.3222
## Adj. R-Squared: 0.3171
## Chisq: 63.2232 on 1 DF, p-value: 1.8456e-15
В этой модели мы помимо оценки коэффициента при предикторе получили оценку константы, которая будет показывать стартовое условие – среднее значение уровня демократичности при условии равенства государственной состоятельности 0 – по всей выборке (здесь базовой категории нет).
Когда мы оценивали FE-модель, мы задавались вопросом, а нужна ли нам действительно такая модель, которая учитывает неоднородность, или в целом можно оценить обычную pooled модель. Подобный тест существует и для выбора между RE-моделью и моделью pooled (тест Бреуша–Пагана). Нулевая гипотеза в таком случае о равенстве \(Var(\alpha_{i}) = 0\). Альтернатива исходя из неотрицательных значений вариации правосторонняя.
pooled <- plm(fh_polity~state_capacity, data=panel, model="pooling")
plmtest(pooled, type=c("bp"))
##
## Lagrange Multiplier Test - (Breusch-Pagan)
##
## data: fh_polity ~ state_capacity
## chisq = 130.3, df = 1, p-value < 2.2e-16
## alternative hypothesis: significant effects
Исходя из результатов теста RE-модель оказывается более предпочтительной по сравнению с моделью pooled.
Реализуем формальный тест для того, чтобы проверить, насколько согласованы результаты FE- и RE-моделей.
fe_country <- plm(fh_polity~state_capacity, data = panel, index=c("country", "period"), effect = "individual", model="within")
phtest(fe_country, re)
##
## Hausman Test
##
## data: fh_polity ~ state_capacity
## chisq = 5.0183, df = 1, p-value = 0.02508
## alternative hypothesis: one model is inconsistent
Результат в данном случае пограничный, и при выборе разного уровня значимости (одного из конвенциональных: 0.05 или 0.01) будет интерпретироваться по-разному. Результаты теста Хаусмана чувствительны к спецификации модели и размеру выборки. Если ориентироваться на уровень значимости в 0.05, то можно сказать, что FE-модель более предпочтительна. В данном случае уже исходя из содержательных обоснований, так как мы работаем со специфической выборкой посткоммунистических стран, можно было сразу остановиться на FE-модели.