论文固定效应和随机效应选

2026-03-30 14:15:04


写实证论文跑面板数据时,经常会卡在到底该选固定效应(FE)还是随机效应(RE)这个问题上。这俩选错了,后面的回归结果可能就不靠谱了。别光看哪个跑出来的P值更漂亮,得看懂它们背后的逻辑。

简单说,核心区别在于你认为那些不随时间变的个体特征(比如企业的“出身”、人的“天赋”)和你的解释变量有没有关系。

要是你觉得这些特征和你的核心解释变量是搅和在一起的,那就得选固定效应。比如研究企业研发投入对绩效的影响,企业的“管理风格”这种自带的属性,很可能就决定了它投不投钱研发。这时候固定效应最稳,因为它通过“组内变换”把那些不随时间变的干扰项全给干掉了,只看同一个体随时间变化带来的影响,结果最干净,不容易有内生性问题。

要是你觉得那些个体特征和解释变量没啥关系,纯粹是随机波动,那就可以选随机效应。比如你研究的是居民收入,样本是随机抽的,那每个人的“先天运气”可能就跟当年的“工作经验”没关系。这时候随机效应效率更高,因为它把组内和组间的信息都用上了,结果更精确。

具体怎么定?得靠三个检验来帮忙。

先看F检验,它帮你决定要不要把个体差异当回事。如果F检验显著,说明个体之间确实有差别,不能混在一起跑普通回归,得用固定效应。

再看LM检验(Breusch-Pagan检验),它帮你决定有没有随机效应。如果LM检验显著,说明存在随机个体效应,这时候才考虑用随机效应模型。

最关键的一步是Hausman检验,这是FE和RE的“终极大PK”。它的原假设是“个体效应和解释变量不相关”(也就是随机效应更合适)。跑完看P值:

如果P值很小(比如小于0.05),说明原假设不成立,个体效应确实和解释变量相关,这时候必须选固定效应,不然结果会有偏。

如果P值很大(比如大于0.05),说明没证据证明两者相关,这时候可以放心选随机效应,因为它更有效率。

当然,还得结合你的研究目的。如果你的重点是因果推断,比如评估政策效果,那固定效应通常更保险,因为它控制了所有不随时间变的遗漏变量。但如果你的研究变量本身就不随时间变(比如性别、地理位置),那就没法用固定效应,只能选随机效应,因为固定效应会把这些变量直接消掉,算不出系数。