【原】TOP刊首次“因果推断: 实证研究中的实证方法演变及准实验方法的发展”

计量经济圈 2022-11-21 发布于浙江

展开全文

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

因果推断：实证研究中的实证方法演变及准实验方法的发展

正文

关于下方文字内容，作者：李笑萦，厦门大学经济学院国际经济与贸易系，通信邮箱：1098200739@qq.com

Causality redux: The evolution of empirical methods in accounting research and the growth of quasi-experiments, Journal of Accounting and Economics, 2022.
This paper reviews the empirical methods used in the accounting literature to draw causal inferences. Recent years have seen a burgeoning growth in the use of methods that seek to exploit as-if random variation in observational settings—i.e., “quasi-experiments.” We provide a synthesis of the major assumptions of these methods, discuss several practical considerations relevant to the application of these methods in the accounting literature, and provide a framework for thinking about whether and when quasi-experimental and non-experimental methods are well-suited for addressing causal questions of interest to accounting researchers. While there is growing interest in addressing causal questions within the literature, we caution against the idea that one should restrict attention to only those causal questions for which there are quasi-experiments. We offer a complementary approach for addressing causal questions that does not rely on the availability of a quasi-experiment, but rather relies on a combination of economic theory, developing and falsifying alternative explanations, triangulating results across multiple settings, measures, and research designs, and caveating results where appropriate.

目录

一、引言

本文主要回顾了会计类文献中所使用的进行因果推断的实证方法。近年来，准实验方法的应用愈发广泛，本文系统梳理了这些准实验方法的主要假设条件，讨论在会计领域的实际应用中存在的一些担忧，并为会计研究者探索感兴趣的因果问题提供了一个思考框架：准实验方法和非实验方法是否、以及何时是完全适用的。

尽管现有文献越来越关注对因果问题的处理，我们仍然需要强调，不能只关注能有准实验设定的因果问题。本文提供了一种补充性的处理因果问题的方法，该方法并不依赖准实验的存在，而是依赖于经济理论的综合，建立并证伪替代性假说，从多样的模型设定、测度方法和研究设计对结果进行三角验证，并作出相应的合理解释。

二、实证方法的演变

2.1 实证类论文的调查

2.1.1调查方法

用标准误、T统计量和P值这三个关键词在JAE、JAR和TAR三本期刊上进行搜索，并进行手动筛选，建立了2005-2019年发表的所有实证研究的清单，共1417篇实证研究论文。

将使用外生冲击或其他特色设置，为感兴趣的解释变量提供随机性变动（例如双重差分方法、工具变量方法、断点回归方法）的研究方法定义为“准实验方法”，其他则为“非实验方法”。通过自动方法和手动方法分别筛选出使用了准实验方法、并且基于这些方法明确地进行因果推断的论文。

2.1.2调查结果

图1的Panel A和Panel B分别呈现了自动方法和手动方法分类的结果。可以看到，在三本会计类期刊中，使用准实验方法的论文数量都呈明显上升趋势。

图1：使用准实验方法论文的百分比趋势

对这些论文所使用的识别方法进行分类。图2显示，绝大多数研究采用的是双重差分方法，其次是工具变量方法，最后是断点回归方法。

图2：三种准实验方法的使用情况

2.1.3 引用分析

接下来，本文尝试量化这些使用准实验方法的论文的影响。一方面，如果使用准实验方法比非实验方法的论文更能提供新颖的见解与想法，那么可以预期，这类论文被引率会更高；另一方面，如果使用准实验方法的论文主要是验证现有的普遍接受的观点（如专有成本降低了自愿性披露），而不是提出新的观点，那么我们预期其被引率会更低。

图4汇报了使用准实验方法的论文在高被引率论文中的占比（Panel A的准实验论文采用自动分类方法得出，Panel B是手动分类），用蓝线表示；橙线则是基于早期趋势，计算出在高被引率论文中的预期占比（如2014年20%的实证论文采用准实验方法，预期会有20%*3*5=3篇高被引率论文中使用了准实验方法）。

可以看到，在使用自动（手动）方法对论文进行分类的高被引率论文中，使用准实验方法的论文占8%（13%），预期百分比为19%（19%）。

图4：使用准实验方法的论文的百分比趋势

2.2 评述

借助贝叶斯学习框架对上述准实验方法文献进行评价。其中，读者的先验是由证据塑造的（Glaeser and Guay, 2017; Christensen, 2019）：当某一个理论以往没有证据时，读者形成的是分散的先验；当提出了新的证据，先验就会大量更新。如果一个理论有着五十年的观测性证据，读者们形成的是明确的先验；更新先验便需要非常令人信服的证据。

图5展示了理论创新与证据标准之间的权衡。对于初步发展的新颖理论，只需要较低标准的证据（左上象限），而随着时间的推移，理论进一步发展与完善，需要更高标准的证据（右下象限），即论文需要提供更有力的证据。

图5：理论革新与证据标准之间的权衡

基于文献调查的结果，本文认为，大多数使用准实验方法的论文都处于右下象限，主要贡献在于研究设定的新颖性，从“相关性”到“因果性”，而非基础的概念性问题本身的新颖性。现阶段的研究正从左上象限转变为右下象限，表明会计研究者对于使用准实验方法得出更有说服力的因果推论越来越感兴趣。

三、准实验方法与因果推断

3.1 线性回归与遗漏变量威胁

3.1.1 OLS假设的主要回顾

在本文所调查的文献中，大多数基于面板数据使用线性回归方法（OLS）来估计相关性，一般形式为：

当以下假设均成立时， OLS可以用于进行因果推断，（1）式的系数可以解释为因果效应。

i.

ii.  独立同分布

iii. 有非零有限四阶矩

然而，当遗漏了与都相关的变量时，假设1就不再成立。因此，在因果推断中令人信服地处理遗漏变量问题至关重要。但正如Angriest和Pischke（2008）指出的，最大的问题在于这些遗漏变量是什么、或者说应该是什么。

3.1.2遗漏变量偏误的主要回顾

假定数据生成过程如下：

但由于遗漏了变量，我们的估计方程仍是（1）式。那么，前的估计系数可以表示为:

其中，第二项即为遗漏变量带来的偏误。可以看到，所遗漏的变量

，只有和结果变量

以及关注的核心解释变量都相关时，才会造成遗漏变量偏误。

3.1.3 缓解遗漏变量偏误的常用方法

根据本文的调查，会计文献中常用三种方法来排除遗漏变量偏误：

（1）具体识别方法：借助理论（包括非正式的经济学直觉和正式的经济模型）为所研究的现象设定合理的替代性解释，并以此为指导，寻找相关的潜在遗漏变量并在回归中加以控制。

优点：能够明确可证伪的替代性经济解释，研究者可以通过设计有说服力的检验来排除。

缺陷：往往无法详尽所有的可替代性解释。

（2）固定效应方法：这种方法承认存在研究者无法具体识别的未知的遗漏变量，并试图进行共同排除。常见的做法是将包含某维度的固定效应的向量进行控制，该向量吸收了沿该维度变化的任何已知或未知的遗漏变量。

优点：解决遗漏变量问题的同时，无需研究者具体指出所有的遗漏变量。

缺陷：很多情况下很可能会加剧遗漏变量偏误（详见4.3节）。

固定效应能使研究者在探索潜在关系时，检查变动的来源，这有助于证伪替代性解释。以Bianchi等（2021，BMMP）的研究为例，该研究探讨了企业和意大利黑手党的联系，与可能表明洗钱的企业财务报表特征之间的关系。这种相关性来源有：（i）与黑手党的联系导致了这些财务结果；（ii）黑手党选择了某些特征的企业建立联系。在控制企业固定效应后，没有发现黑手党联系与企业财务指标之间存在关系的证据，因此，尽管无法确定因果关系，也为当局提供了足够的信息，来制定一套可能成为黑手党目标企业的粗略指标。

（3）截面交互项方法：借助理论（包括非正式的经济学直觉和正式的经济模型）,推测出的边际效应在某些设定、或者不同子样本之间存在显著差异，而若是遗漏某变量则不再有显著差异。实践中，常采用分组回归或交互项方法。交互项方法的方程如下：

交互项前的预期系数

与分组回归所得的

相等。假定遗漏变量的边际效应不随

而变化，

就与遗漏变量偏误无关。

以Guay等（2016）的研究为例，该研究探讨了财务报表复杂性与自愿性披露之间的关系。为了排除所得到的结论因为遗漏变量（如时间趋势）而有偏，利用交互项方法对比企业经理透明动机与混淆业绩动机的情况，发现财务报表复杂性与自愿性披露之间的关系在经理有混淆业绩动机时更弱，从而排除了这种替代性解释。

3.2 准实验方法作为潜在解决方案

双重差分方法本质上是根据面板数据进行OLS回归，继承了所有OLS的一般假设。尽管有着不同形式，但基本想法都是进行一个准实验，将观测结果尽可能随机分配给处理组与对照组。

3.2.1 经典DID方法

计量方程设定如下：

其中，=1表示企业i是处理组，=1表示年份t处于事件发生后。经典DID方法的特点是，所有处理组个体都在同一时点受到干预。下表具体展示了该方法的原理：

3.2.2 拓展

（1）广义DID方法

计量方程设定如下：

（2）交错DID方法

计量方程设定如下：

其特点是，所有处理组个体受到干预的时点可以不同。更简洁的表达式为：

包含了从未受干预的样本（纯对照组）和受到干预前的处理组样本。然而，学者们近期对这两部分混合起来产生了争议，Goodman-Bacon（2021）指出了这种混合可能导致估计系数有偏的情况，Baker等（2021）描述了偏误产生的过程：在交错型DID中，随着时间的推移，早处理组受到干预后可以作为晚处理组的对照组，其结果的变化会在晚处理组的变化中被减去。

3.3 理论对因果推断的重要性

3.3.1 理论对解释实证结果至关重要

正如前文所述，在特定的基本假设下，能够用因果关系来解释估计所得的相关性。而理论的重要意义之一，便是有助于回答在特定的研究设计中，需要多大程度地关注遗漏变量。

此外，理论也有助于我们判断所研究问题中内生性的本质。如理论表明强制性和自愿性披露是相互依存的，因此，两者进行回归的得到的相关性不应该解释为因果关系。

如图6所示，一个科学的研究过程的前提是，研究者从理论出发，对其进行检验，根据检验结果完善理论，基于完善的理论进行更严谨的检验。而得出因果推断的过程，则是不断地排除替代性假说，进一步完善了理论。

图6：科学研究的过程

3.3.2 另一种观点

另一种观点认为，理论对于因果推断并不是必须的，主要包括实验室实验、现场实验和标准的“A/B”测试等完全随机分配的场景。但需要注意的是，一方面，任何因果关系的检验，在选择方法和研究设计时都隐含了理论的应用；另一方面，在会计领域很难存在完全随机分配的数据。

3.3.3 借助理论区分伪相关关系

在进行因果推断中忽略理论的一个危害是，难以区分出伪相关关系，即没有特定意义的随机的相关性。即使是使用了复杂的计量方法，进行了一系列稳健性检验，这种伪相关性仍可能存在。基于Vigen（2015）的研究，本文汇编了包含二十多项自愿性披露和收益管理常用指标的数据集进行分析。

从表1可以发现，采用工作场所限制吸烟的州法律和采用限制获取枪支的州法律都与自愿披露（使用当年管理收入预测的数量衡量）显著负相关。然而，这些结论真的可靠吗？我们并没有提出相关的理论来说明，为什么这些法律与自愿性披露有关，也没有指出为什么在这些情景下预期的管理收益是合理的衡量指标。

因此，如果不阐明理论，就无法有意义地谈论“识别策略”“严谨设计”“可信证据”。

表1：进一步的检验结果

3.4 理论对结论的推广至关重要

一方面，如果研究没有理论基础，就没有依据将结论进行推广；另一方面，如果实证研究密切遵循了理论，并在特定研究设定中对其进行检验，就有充分的理由相信该研究的推论能进行推广。因此，特定背景下的研究结论能否被推广，关键在于论文理论基础的是否深厚。本文特别强调了两点：

（1）对结论可推广性的担忧，取决于研究的目标。如Barth等（2012）的研究考察了采用《国际财务报告准则》是否增加了会计可比性，关注准则本身，因此对结论进行推广的担忧微乎其微；Hail等（2014）则借鉴了经理和股东之间代理冲突的广泛理论，使用《国际财务报告准则》在利益结构中提供的外生变化，考察经理和股东之间信息不对称的减少是否会导致企业改变其支付决策。显然，后者的研究目的是将基于准则得出的结论，推广到关于信息不对称的一般理论。

（2）在会计研究者不关注的方面，许多文献的贡献都隐含地取决于研究者将结果进行外推的能力。例如，会计领域的学者不太可能对士兵死亡、器官捐赠、面部特征等感兴趣，除非这些因素可以分别用于衡量政治成本、社会资本和个人可信度等。每一项这些研究的贡献，都隐含地取决于将结果推广到会计研究者所感兴趣的理论中的能力。 

四、在会计文献中实际应用准实验方法的问题

4.1 外生性v.s. 准随机分配机制

4.1.1 概念

“外生事件（变量）”虽起源于所研究系统之外，但并不一定能提供类似随机实验的分配机制。与之相关的经典问题是选择性偏误。

在双重差分方法中，这一问题尤为关键，造成其估计系数实际上是处理组的平均处理效应ATT和选择性偏差之和。因此，在解释结果的因果性时需要特别注意。

4.1.2 数值例子

假设在第三期，监管机构强制要求所有企业采取行动（如要求设置多样性董事会、强制采用《国际财务报告准则》或强制环境披露）。由于A型企业已经采取了行动，只有B型企业会受到影响。各期预期现金流如下：

为估计企业采取行动对现金流的因果效应，有三种方法（1）只关注B型企业，比较强制要求发生前后的现金流差异（2）经典DID（3）广义DID。估计结果分别对应表2的（1）-（3）列。其中，只有（1）的估计系数反应了强制要求对处理组现金流的因果效应，ATT=-1，其余两列均包含了选择性偏差。

表2：数值例子

4.2 平行趋势检验

平行趋势假设是所有DID方法的关键。以（11）式为基础，该假设条件可以表达为:。可见，其本质与截面交互项方法中的“不存在相关遗漏变量”的假设是一致的。在分配处理组与对照组时，如果所遗漏的变量与相关，导致偏误产生，则表现为两组在结果变量上有不同的时间趋势，故该假设称之为“平行趋势”。因此，与无法检验是否存在相关的遗漏变量一样，实际上也无法检验平行趋势是否满足。

图7直观说明了这一点：尽管处理组和对照组的结果存在差异，但在事前随着时间的推移，这种差异是恒定的；而在事后，假设处理组没有接受干预，其潜在结果如图中标注，是不可观测的反事实结果。因此，大多数对平行趋势假设进行的检验都需要另一个假设，即如果事前两组是不平行的，那么事后处理组不可观测的反事实结果与对照组也不大可能平行，如图7的Panel B所示。

图7：平行趋势假设

一种常用的检验方式如图8所示，关注处理组和对照组之间随时间变化的差异。但缺陷在于，无法直观看出随时间变化的差异是由处理组还是对照组所驱动的。

图8：处理组与对照组差异随时间的变化

在经典DID方法中，用一系列年份虚拟变量替换以进行检验，计量方程设定如下：

注意在该方法下，需要剔除某一年作为基准期。衡量的是在基准期两组之间的差异，θ表示每个时期两组之间的差异相对于基准期所发生的变化。在实践中，需要额外考虑两点：一是基准期的选择。根据调查结果，大多是选用了事前一期；二是可能需要对多个时期进行汇总，如干预发生在2000年，基准期选择为1999年，为 1997年之前的所有年份、1997年、1998年、1999年（基准期系数为0）、2000年、2001年、2002年和2002年之后的所有年份，估计出对应的八个系数 ，如图9所示。

图9：经典DID方法的平行趋势检验

在交错DID方法中，则需要将上述的“日历时间”转化为“相对时间”。具体做法是，生成一个表示该年年份与干预年份之差的变量，衡量相对于发生干预的时间，如t<-3、t=-3、t=-2、t=-1、t=0、t=1、t=2、t>2，t=1就表示相对于该个体受到干预过去了1年。这种方法中，更需要关注基准期的选择。以工作环境吸烟法为例，预期实施该法律后需要两年时间才生效，因此，将t=-3设置为基准期，t=0时法律生效。利用图10，除了能够直观判断平行趋势，还有两点值得关注的作用：（1）处理效果何时开始显现（2）处理效果是否持续存在。

图10：交错DID方法的平行趋势检验

4.3 固定效应方法

4.3.1 加剧遗漏变量偏误的可能

当组内差异是相关遗漏变量的来源时，控制组间固定效应会放大与该遗漏变量的相关性，导致组内分析的偏误更大。这是因为，固定效应只能去除不同组之间的差异。

事实上，如果不了解数据生成过程，或者对差异的来源没有准确的理论指导，是否控制某种层面的固定效应是难以确定的。延续表1的分析，控制不同层级的固定效应，结果如下表3所示。

尽管不能得知数据的真实生成过程，也没有强有力的理论指明哪一种层级的控制更优，但根据（1）至（4）列的结果，Panel B中枪支法的效果并不稳健，而Panel A中吸烟法的效果较为稳健。此外，Panel A中各种固定效应吸收了吸烟法约50%的变动，Panel B中则吸收了高达90%的变动才具有统计显著性，表明该系数本质上只使用了很小部分数据进行有效估计，这就可能减弱结果的稳健性。

表3：控制不同层级固定效应的结果

4.3.2 可能不利于结果的稳健性

当所关注的因变量中，大部分的变化都被高维固定效应吸收，此时仍有差异、能用于估计系数的有效样本仅为少数，即使本身样本量非常充足。此时回归结果所汇报的样本量也往往会有误导性。

此外，这种情况也会引发多重共线性的问题。一个极端例子是，当固定效应的吸收率达到100%，即因变量几乎是固定效应的线性组合。存在多重共线性时，回归结果也难以稳健，甚至符号也会发生变化。

借助Armstrong等（2019）的数据进行说明。该研究估计的是经理人个人所得税（）与企业风险投资决策（）的关系。Panel A中的第（5）列控制了更多固定效应，吸收了因变量99.2%的变动，意味着仅使用0.8%的变动进行估计；此时方差膨胀因子VIF较大，表明存在较强的共线性。进一步地，剔除10个样本再进行估计，结果如Panel B所示，此时系数大小与显著性都发生了很大变化，说明在该研究中控制高维固定效应导致结果更不稳健。

表4：固定效应与多重共线性

因此，尽管固定效应方法是缓解遗漏相关变量的强大工具，但它也需要研究者进行权衡。尤其是在控制高维固定效应时，更需要对不同层级的固定效应结构进行权衡，并报告VIF、因变量被固定效应吸收的程度。

五、非实验方法能否减轻因果推断的困难？

5.1 当准实验方法不可行时非实验证据的作用

能提供准实验设定的场景是有限的，尤其是，所感兴趣的一些因果关系无法得到处理组与对照组的随机分配机制。但实际上，即使没有准实验的设计，或者基于明显存在内生性问题的数据，研究者也能够探索因果关系，进行适当的推断。

例1：Healy（1985）研究了绩效奖金对经理会计决策的影响。这是一个因果性问题。但准实验设定很难获得，因为理性的董事会能基于经理的预期行动做出反应，使得绩效奖金计划和会计决策都是内生形成的。Healy在解释其研究结论时非常谨慎，将两者的相关性描述为“一致的”或“建议的”因果关系。然而，尽管存在内生性问题，该文献也为后续激励薪酬的研究奠定了基础。

例2：Asay等（2021）研究了特定的避税策略如何影响消费者行为。这个问题本质上也是因果关系：避税会导致消费者抵制吗？同样，我们也无法获得用避税进行随机分配的设计场景。Asay等通过对多个非实验设计的推理进行三角验证，提供了有说服力的因果证据，表明消费者在做出购买决策时并不关心避税策略。这种方法通常被称为“三角验证识别方法”。

Heckman和Singer（2017）将三角验证方法称为“溯因学习”模型，如下图所示。

图11：“溯因学习”模型

尽管未知数据的真实生成过程，但可以根据多种研究方法、数据集、模型设定和检验来寻求证据，将替代性解释（包括理论机制与测量误差等）进行逐一验证。正如Sherlock Holmes所说，当排除了所有不可能之后，剩下的无论多么不可能，都必须是真相。

延续表1的研究，并使用了文献中常见的两种自愿披露替代解释，企业的新闻稿数量和8-K文件数量作为替代性解释进行分析。表5表明，法律与这两种代替解释均没有相关性，这使得表1的结果更可信。

表5：排除替代性解释的三角验证

5.2 结合准实验和非实验证据来识别因果机制

遵循Kahn和Whited（2018）的研究，在因果推断的背景下区分“估计”和“识别”很重要。

对因果效应的估计：是一个涉及假设随机变化的统计过程，成功的估计回答了一个问题：效果是什么？

对因果效应的识别：涉及对潜在因果效应的来源进行推断。成功识别回答的是：为什么会有效果？

如图12所示，X通过A和B影响Y，两者都无法观察到。使用X中的准随机变化，可以估计X对Y的因果影响（即什么样的效应？），而无需确定形成效应的潜在机制A和B（即为什么有这样的效应？）。后者的识别实际上很有挑战，因为不仅需要需要X的随机变化来估计其对A和B的影响，还需要A和B的随机变化来估计它们对Y的影响。此外，为了排除X对Y没有直接影响（独立于A和B），需要证明X对Y的因果效应在控制A和B后不存在。

图12：“估计”与“识别”

因此，在实践中更建议的做法是将准实验方法和非实验方法结合起来。例如，首先找到一个能提供X中随机变化的分配机制，来估计X对Y的因果效应；研究者推测基础机制是通过A形成的，但A尚未被观察到，然后借助理论说明X是否会影响A，并分别在这两种场景下，再次估计因果效应最后进行比较。这与交互项或三重差分方法的原理是类似的，X对Y的因果效应所存在的“异质性”能为机制提供强有力的证据。尽管分组估计的变量可能是内生的，但也有助于排除替代性解释。

例1：Balakrishnan人（2014）研究了管理者是否会利用增加自愿性披露，来抵消分析师经纪公司倒闭所带来的流动性下降。自愿性披露与流动性是内生的，因为经纪公司倒闭，管理者选择通过自愿性披露来抵消预期的流动性下降。

他们对提供自愿性披露和未提供的企业分别进行估计，发现前者中流动性下降在下一季度逆转，而后者经纪公司倒闭的影响仍存在。可见，尽管“选择是否自愿披露”本身是内生的，仍有助于排除替代性解释。

例2：Christensen人（2016）利用各国通过欧盟证券法规的时间不同，来估计证券法规对流动性的因果效应。结论是，在各国通过该法规后，流动性显著增加，并推测该法规的效果取决于现有的各国条件。他们考虑了两种替代性假说：（i）在现有证券法规薄弱的国家，新证券法规的影响更大；（ii）制约现有法规有效性的机构、市场和政治力量，也限制了新法规的有效性。根据现有证券法规的严格程度进行分组估计，发现法规薄弱的国家，新证券法的因果效应更弱。因此，尽管该分组变量也是内生的，但也有助于排除第一种假说。

5.3 当准实验证据与非实验证据发生冲突

尽管两种方法结合起来使用，能得到强有力的因果推论，但另一种情况也是常见的，即两种方法提供的证据产生了冲突。这往往表明，所研究的现象可能比我们感知的更深入、更复杂，很可能会产生新的见解。此时，不应该严格偏好某一种方法的证据，而是应该考虑是否存在不同的影响渠道。

考虑进行审计对企业价值的影响。设想以下两种渠道，如下图13所示：（i）企业选择进行审计，以向投资者发出未来信息流的积极信号，即“信号通道”（ii）进行审计会对独立于信号的投资水平和公司现金流造成实际影响，即“真实效应”。

图13：审计影响企业价值的机制

假设在非实验环境中，我们发现投资者会对企业进行审计做出积极反应，但在实验环境中，发现投资者并没有做出反应，即两种方法得到的证据发生冲突。由于非实验方法缺乏随机差异，很可能形成一种误解，即该方法得出的证据被内生性所混淆。但实际上，是因为这两种方法的因果渠道并不一样：

在非实验的场景下，企业能选择是否进行审计，向投资者发出信号，因此“信号通道”和“真实信号”都存在，只是存在固有的内生性担忧，也无法分离两种渠道；

而在随机实验的场景下，由于企业是否进行审计的选择被剔除，无法用审计向投资者发出未来现金流的信息，“信号通道”被阻断，只剩下“真实效应”，因此，无法提供有关“信号通道”的推断。

六、结论

本文的调查侧重于会计领域的研究是如何进行因果推断的。给出了以下三方面的注意点：

（1）可复制性是任何科学研究的最低质量标准。尽管一项研究不够完美，但如果其结论可以复制，也能为未来的研究提供信息。Angrist和Pischke（2010）将准实验方法作为因果推断中的“可信度革命”。

（2）本文建议，研究者汇报由多种研究方法和模型设定所得出的结论，而不是对结论进行主观筛选，得到扭曲的因果推论。

（3）会计文献中很多研究并不试图解决因果问题，但仍然做出了重要贡献，尤其是在提醒研究者注意数据模式方面。因此，虽然因果推断很重要，但并不是做出贡献、推进知识的前沿的唯一手段。

关于DID，参看：1.120篇DID双重差分方法的文章合集, 包括代码,程序及解读, 建议收藏！2.诚实双重差分法DID, 面板事件研究法和Bacon分解的经典应用文！3.前沿: 多期或渐进或交叠DID, 如何进行平行趋势检验呢？4.多期DID或渐进DID或交叠DID, 最新Stata执行命令整理如下供大家学习，5.DID前沿: 5种方法估计事件研究的因果效应, 并使用绘制系数和置信区间, 详细代码和数据，6.事件研究法开展政策评估和因果识别, 分享8篇提供数据和代码的文章，7.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码！8.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了！9.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,10前沿: 9份各种DID方法最新进展“阅读小组”Slides分享

下这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

4年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀是通过感染优秀而互相成就彼此的。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：计量经济圈 > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

计量经济圈

关注对话

TA的最新馆藏

避坑, 在一篇论文中做了X→Y之后, 要不要再附加分析下Y→X呢? 听听同行怎么说.
群友热议, 手把手教你平行趋势非线性违背检验, 亲自解读 (附代码), 原理一学就会.
群友们聊聊经济学界的“网红”方法Bartik IV, 我都懂它的原理了.
Bartik IV方法详解及其在经济学中的应用
3个重要的实证研究问题, 关乎机制分析,异质性,交互项, 审稿人经常这么问你.
重塑: 机器学习中经济金融领域常用代码库和完整案例代码, All in机器学习.

喜欢该文的人也喜欢更多

热门阅读换一换