[原创]双重、三重差分法

这里只有作者精心编写的研究经历!
回复
头像
hellohappy
网站管理员
网站管理员
帖子: 282
注册时间: 2018年11月18日, 14:27
Been thanked: 2 time

#1 [原创]双重、三重差分法

未读文章 hellohappy » 2019年6月10日, 13:46

前言:
    参考资料为陈强的计量书和下面的pdf。

双重差分:

    两期双重差分:

        在做随机实验或自然实验时,实验的效果常常需要一段时间才能显现出来,而我们关心的恰恰是因变量实验前后的差异。为此,考虑以下两期面板数据:
yit = α + γD+ βxit + υ+ εit    (i = 1,...,n; t = 1,2)    (1)

        其中,Dt为实验期虚拟变量(Dt = 1 , 如果t = 2, 实脸后;Dt = 0, 如果 t = 1 ,实验前),υi 为不可观测的个体特征,而政策虚拟变量(policy dummy)满足:

            若 i ∈实验组,且 t = 2,则 xit=1; 其他情况下 xit=0 。

        因此,当 t=1 时(也就是第一期),实验组与控制组并没有受到不同的对待, xit都等于0 。当 t = 2 时(第二期),实验组  xit=1,而控制组 xit依然等于零。如果该实验未能完全地随机化(比如,为观测数据而不是完全控制变量下的实验数据),则 xit可能与被遗漏的个体特征 υ相关,从而导致OLS估计的不一致。由于是面板数据,可以上面方程进行一阶差分(第二期减去第一期),以消掉 υ,方程变为:
Δyi = α + γ + βxi2 + Δεi       (2)

        用OLS估计上式,即可得到一致估计。根据与差分估计量(differences estimator)同样的推理可知
双重差分估计量示意图.png
双重差分估计量示意图.png (53.69 KiB) 查看 478 次
双重差分估计量示意图.png
双重差分估计量示意图.png (53.69 KiB) 查看 478 次

        因此,这个估计方法称为“双重插根估计量”(Difference-in-Differences estimator,简称DD),含义为实验组的平均变化与控制组的平均变化之差,参见上图。从图中可以看出双重差分估计量已经剔除了实验组与控制组“实验前差异”(pretreatment differences)的影响。

        对于双重差分估计量,也可以引入其他解释变量{Zi1,...,ZiK}:
Δyi = γ + βxi2 + δ1Zi1 + ... + δKZiK + Δεi       (3)

        然后用OLS估计上式。

    多期双重差分:

        显然,以 Δyi 为解释变量的双重差分法(参加公式2和3),不适合用于多期数据。此时,需要回到以 Δyi 为被解释变量的面板模型。为了简洁,暂时忽略其他解释变量{Zi1,...,ZiK},并仍然假设为两期数据。可以证明,方程2与以下两期面板模型等价:
yit = β0 + β1Gi*Dt + β2Gi + γDt + εit   (i = 1,...,n; t = 1,2)    (4)

        其中,Gi为实验组虚拟变量(Gi 等于1,如果个体i属于实验组;Gi 等于0,如果个体i属于控制组),Dt为实验期虚拟变量(Dt 等于1,如果t = 2;Dt等于0,如果 t = 1),而互动项 Gi*Dt = xit (取值为1,若 i ∈ 实验组,且 t = 2;反之,取值为0)。在式(4)中,分组虚拟变量 Gi 刻画的是实验组与控制组本身的差异(即使不存在此实验,或没有发生此事件,也会存在此时间趋势),而互动项 Gi*Dt 才能真正度量实验组的政策效应。如果有其他解释变量 {Zi1,...,ZiK},可以直接放入式(4)中。

        当 t = 1 时,式(4)可以写为
yi1 = β0 + β2G+ εi1  (5)

        当 t = 2 时,式(4)可以写为
yi2 = β0 + β1Gi*D2 + β2G+ γ + εi2  (6)

        将式(6)减去式(5)可得
Δyi = γ + β1Gi*D2 + (εi2 - εi1) =  γ + β1xi2 + Δεi (7)

        式(7)与式(2)完全相同。因此,对式(4)进行OLS估计,得到的 Gi*Dt 的系数就是双重差分估计量。使用式(4)面板形式的双重差分估计量的好处在于,他可以很容易推广到多期数据情形。比如,共有4期数据,则可估计如下方程:
yit = β0 + β1xit + β2Gi + γ1D2t + γ2D3t + γ3D4t + εit   (i = 1,...,n; t = 1,2,3,4)    (8)

        其中,D2t,...,D4t 分别对应于第2到4期的时间虚拟变量(以捕捉即使没有政策变化也可能存在的时间效应),而主要感兴趣的政策虚拟变量 xit 的定义为:
            若 i ∈ 实验组,且 t ∈ 实验期,则 xit=1; 其他情况下 xit=0 。 

        在式(8)中,xit 的系数OLS估计值就是双重差分估计量。显然,在两期数据中,xit 就是交叉项 Gi*Dt 。双重差分法的优点在于,他同时控制了分组效应 Gi(group-specific effects)与时间效应 Dt (time-specific effects)。然而,将双重差分法应用于观测数据时,如果政策虚拟变量 xit 为内生,比如 xit 与影响 yit 的遗漏变量相关(此遗漏变量为扰动项 εit 的一部分),则依然得不到一致估计。

    三重差分:

        双重差分法的隐含假设是,即使没有政策变化,控制组与实验组的时间趋势也是一样的;在式(4)中表现为共同的时间趋势项 γDt 。然而,如果控制组与实验组的时间趋势不同,比如前者系数为  γ0,而后者系数为   (γ01),则式(4)应写成:
yit = β0 + β1Gi*Dt + β2G+ γ0Dt + γ1Gi*Dt + εit
               =β0 + (β11)Gi*Dt + β2G+ γ0Dt + εit         (9)

        因此,用OLS估计上式只能得到对(β11)的一致估计;无法得到对实验效应 β1 的一致估计。此时,须进一步改进双重差分估计量。

        来看一个具体例子。假设美国B州针对65岁或以上老年人(记为E,表示elderly)引入了一项新的医疗保健政策,而该政策不适用于65岁以下人群(记为N)。欲考察此政策对健康状况 y 的影响。一种做法是,以B州65岁或以上人群作为实验组,而以该州65岁以下人群作为控制组,然后进行双重差分估计。此种DD法的潜在缺陷是,年轻人相对于老年人的相对健康状况本身可能随着时间发生变化(即使未推出此新政策),比如由于联邦政府同时期的其他政策变化所引起。因此,另一种做法是,以相邻A州的65岁老年人作为控制组,然后进行双重差分估计。然而,第二种DD法也有缺陷,因为它忽略了A州和B州老年人的健康状况,即使在没有新政策的情况下,其也有可能有不同的时间趋势,比如两个州的州情不同。更稳健的做法则是将以上两种DD法结合起来,估计如下方程(为了简洁,省略个体下标 i 和时间下标 t):
y = β0 + β1B + β2E + β3B*E + γ0D + γ1D*B + δD*B*E + εit    (10)

        其中,B为B州虚拟变量(B州 = 1,A州 = 0),E为老年虚拟变量(老年 = 1,其他年龄 = 0),D为时间虚拟变量(第二期 = 1,第一期 = 0),互动项 D*B*E(表示第二期B州老年人)的系数 δ 即为政策效应,记其估计量为DDD,则OLS估计量 DDD 可以表示为
DDD = [(ȳBE2-ȳBE1)-(ȳBN2-ȳBN1)]-[ȳAE2-ȳAE1)-(ȳAN2-ȳAN1)]    (11)

        其中, ȳBE2 表示第2期B州老年人的样本均值, ȳBE1 表示第1期B州老年人的样本均值,以此类推。此估计量称为“三重差分估计量”(Difference-in-difference-in-Differences estimator,简计DDD)。上式右边的第一个方括号就是以B州年轻人为控制组的DD估计量,但此DD估计量没有控制实验组和控制组(在未引入新政策的情况下)的时间趋势差异(trend differential);上式右边第二个方括号通过A州来捕获时间趋势差异;如果A州和B州的时间趋势相似,则上式就是对政策效应的可信估计。

        下面对式(11)进行说明。根据式(10),对应于 ȳBE2 的总体期望为:
E(ȳBE2) = β0 + β1 + β2 + β3 + γ+ γ+ γ+ δ    (12)

        类似的,对应于 ȳBE1 的总体期望为
E(ȳBE1) = β0 + β1 + β2 + β3    (13)

        将式(13)减去式(12)可以得到对应于 (ȳBE2-ȳBE1) 的总体期望
E(ȳBE2) - E(ȳBE1)= γ+ γ+ γ+ δ    (14)

        根据同样推导可得,
E(ȳBN2) - E(ȳBN1)= γ+ γ1   (15)
E(ȳAE2) - E(ȳAE1)= γ+ γ2    (16)
E(ȳAN2) - E(ȳAN1)= γ    (17)

        综合式(14、15、16、17)可知,对应于式(11)的总体期望为
{[E(ȳBE2) - E(ȳBE1)]- [E(ȳBN2) - E(ȳBN1)]}- {[E(ȳAE2) - E(ȳAE1)]- [E(ȳAN2) - E(ȳAN1)]}
= [(γ+ γ+ γ+ δ) - + γ1)] - [(γ+ γ2- 0)]
= [γ+ δ] - 2]
= δ        (18)

        上面的两期三重差分,用图来表示,可以画成这样:
三重差分原理图.png
三重差分原理图.png (606.65 KiB) 查看 369 次
三重差分原理图.png
三重差分原理图.png (606.65 KiB) 查看 369 次

        当然,在式(10)中,也可以加入其他解释变量 {Zi1,...,ZiK},或推广到多期数据。

DD&DDD.pdf
(383.03 KiB)
DD&DDD.pdf
(383.03 KiB) 尚未被下载
hellohappy

谢谢老板~

使用微信扫描二维码完成支付


Link:
Hide post links
Show post links


回复