stata里reghdfe函数在不同固定效应设计下的观测值问题
最近在修改一篇working paper发现,用reghdfe做回归的时,在相同的基准模型中添加不同的交互固定效应,模型的观测值数量不同。由于担心审稿人的质疑,进一步讨论了这一问题。后来也与学校内其他老师交流,发现也有类似的问题。但是老师的解决思路是通过if e(sample)的方式强行使得各模型回归观测值数量相同。感觉这一方式有点治标不治本,但是查阅了很多中文材料,咨询过一些国内的大佬,好像都没
最近在修改一篇working paper发现,用reghdfe做回归的时候,在相同的基准模型中添加不同的交互固定效应,模型的观测值数量不同。由于担心审稿人的质疑,进一步讨论了这一问题。
后来也与学校内其他老师交流,发现也有类似的问题。但是老师的解决思路是通过if e(sample)的方式强行使得各模型回归观测值数量相同。感觉这一方式有点治标不治本,但是查阅了很多中文材料,咨询过一些国内的大佬,好像都没有给一个很好的解释。后来找到一篇参考文献,大致解释清楚了这一函数观测值数量的问题。参考文献如下:
Correia S. Singletons, cluster-robust standard errors and fixed effects: A bad mix[J]. Technical Note, Duke University, 2015, 7.
总结起来解决这一问题的思路如下:
1.和审稿人argue。观测值数量主要是singleton(大致可以理解为由于虚拟变量过多所导致被完全解释的观测值,在经过匹配的数据里比较常见)的问题,从理论上来说可能对估计有不好的影响。可以引用这篇文章里的一些解释。
2.手动删除singleton。但是这里有一个迭代,因为你删除Singleton的操作本身也会产生新的singleton,导致需要反复删除,处理起来比较麻烦。此外,由于模型设定不同,singleton的数量也不同,因此即便手动删除也无法保证观测值数量相等,因此更建议方法1。
3.加入keepsingletons 选项。原文里也提到,删除singleton虽然能解决一部分问题,但是同样会创造一些新的问题。也可以加入这一选择保留所有的singleton,使得估计结果与areg,xtreg,reg等完全一致。这一方式相对来说最为简单~

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)