论文双重差分模型怎么设计?
2026-03-27 13:49:01
我们在写论文中双重差分模型内容,其实就是为了把政策或者某个大事件带来的“纯影响”给抠出来。咱们平时直接看数据,周围乱七八糟的因素太多,很难判断是不是政策的功劳,所以得靠这个模型把干扰过滤掉。
搭这个模型,第一步就是把人分好类。得有两拨人,一波是被政策直接砸中的“处理组”,另一波是啥事没摊上的“对照组”。拿最低工资调整这事举例,涨工资那个地方的工人就是处理组,没涨工资地方的工人就是对照组。这两拨人得差不多,不能一个天上一个地下,不然没法比。有时候为了把对照组选得更准,还得用倾向得分匹配啥的把数据洗一洗,让两组人除了政策受影响没受影响,其他方面都差不多。
时间这块也得划拉清楚,啥时候政策没实施,啥时候开始实施。一般得设个时间变量,实施前是0,实施后是1。再给处理组标1,对照组标0。这两个变量一交叉,就是模型里的核心——那个交互项。模型成不成立,全看这个交互项的系数争不争气。要是它显著不等于0,那就说明政策确实起作用了。
不过有个大前提必须过,就是“平行趋势假设”。简单说,就是政策实施之前,这两组人的变化趋势得差不多,跟两条平行线似的。要是还没实施政策呢,两组人就已经跑出两条道了,那之后的差别就不能全赖政策。所以跑模型前,一定得画个图看看,或者做个检验,把这个前提搞定,不然论文很容易被人挑刺。
写到论文里的时候,别光干巴巴扔个公式。处理组和对照组到底是谁,政策啥时候开始的,数据用了多久,这些都得交代明白。重点得说那个交互项系数是个啥情况。还得做稳健性检验,比如换个时间段,换个对照组,看看结论还稳不稳。要是咋折腾结果都差不多,那论文的说服力就上来了。