分享

实证研究干货专题六:异质性分析的思路与视角

 计量经济圈 2023-04-20 发布于浙江

01

异质性分析的基础:何为异质性、什么时候该考虑异质性

异质性是实证研究文章通常要进行讨论的部分,并不是因为写八股文的需要,更不是为了拼凑内容而讨论异质性。对于实证研究论文来说,通常在讨论因果关系的时候由于回归样本的局限,即研究得出的因果关系可能仅是使用样本得出的结论,因此我们要尽力说明样本的一般性和代表性,使得样本更好地符合总体情况从而得出一般化的结论。而现实情况是这种一般化的结论并不一定是稳定的,可能由于样本本身存在的一些特质或者是外部的一些客观因素的干扰,从而产生与主要结论不一样的因果关系,这便是进行异质性讨论的原因,即一般的因果关系中可能包含了异质性结果,因此需要将这些异质性找出来讨论,使得研究结论更加符合现实情况。因此,当我们研究的因果关系中存在很明显的异质性时,我们就必须结合这些异质性特征进行进一步地分析,而不是像八股文般要强行在文章中讨论异质性,或者觉得文章内容不够充实再增加一些异质性会使得文章更加丰富,这些做法都是不可取的,异质性分析必须让读者更加信服主要结论是符合现实情况的,这才是讨论异质性该考虑的内容。

02


异质性分析应该怎么做:分组讨论还是加入交互项

异质性主要按照分组回归和加入交互项这两种方法展开分析,分组回归和加入交互项的区别在于:首先,当异质性变量为虚拟变量时,加入交互项反映的是两组样本差分的结果,即虚拟变量为1的样本相较于虚拟变量为0的样本的变化情况,而分组回归是直接反映两组样本的回归结果;其次,分组回归将总样本拆分成了两部分,但是这两部分样本是否仍然符合随机分布特征有待验证,加入交互项是按照总样本进行回归的,不需要再次说明样本的随机分布特征;再者,加入交互项比分组回归有着更严格的假设,它需要控制变量的系数不存在组间差异,只需要判断交互项组间系数差异是否显著即可,而分组回归假设较为宽松,对控制变量的系数差异没有要求;最后,两者的判断逻辑是:当交互项显著时,说明存在异质性影响,交互项可能更容易得出显著的结果,而分组回归需要检验两组结果系数的组间显著性差异,以此说明异质性的存在,而且分组回归的结果不一定显著。
需要注意的是,有时候分组回归结果显示一组显著一组不显著,这并不代表两组具有显著性差异,就不再进行组间系数差异的判断,而是可能回归的过程中存在其他问题的干扰,比如两组样本的差异,不显著的一组可能是由于样本过少导致,这点一定要引起初学者的注意,往往过度关注分组系数的结果而忽略了样本差异因素导致的结果偏差,虽然统计学上显著,但这种结果就变得毫无意义,还是前面所说的,如果一定要按照既定划分的样本做异质性,至少要保证两组样本的随机分布特征和符合总体分布,否则仅根据回归系数显著与否判断两组之间的异质性是不足的,分组回归至少要保证两组样本的观测是相近的,然后在组间系数差异显著的基础上才能判断异质性,当然,两组系数结果相反也是一样的道理。
加入的交互项的异质性变量也可以是连续变量,这与分组回归的逻辑不同,是根据异质性变量的持续变化(如异质性由高到低、由低到高)导致交互项系数的显著与否,并不是一定在样本之间划出明确的异质性阈值,这种逻辑通常要考虑样本的异质性是在总体样本中交错叠加的,无法按照一个明确的阈值可以将样本划分出来,比如我们常用的中位数或者均值的高低,这时候按照连续的异质性变量作为交互项是更好的做法。我们可以根据上面的分析得出,通常情况下异质性采用加入交互项分析是更好的做法,首先这种做法能够保持基准分析的样本,从而排除样本选择的偏差导致的估计结果偏差;其次,直接可以按照交互项系数的显著性判断是否异质性,避免了再进行组间系数差异的检验;最后,加入交互项一般要求控制变量之间不存在组间显著性差异,因此异质性分析需要排除控制变量造成的异质性干扰。

03


异质性变量的选择逻辑:什么是好的异质性变量

前面我们提到加入交互项有着较高的假设前提:即控制变量不存在组间差异。因此,控制变量并不是作为合适的异质性变量加入到交互项中,而且异质性分析通常使用控制变量也不是好的异质性变量。一个好的异质性变量是客观存在,对于因果关系是一个外生的影响,由于异质性的存在,自变量对因变量的影响存在不同,而控制变量是作为影响因变量的重要干扰因素,是需要在实证回归中排除它的对因变量的干扰,而不是讨论它的存在对因果关系造成的异质性。通常来说,一个好的异质性变量应该是能够影响自变量或者因变量,而且是相对外生的,只会对因果关系造成异质性影响,而不是仅仅作为自变量或因变量的影响因素存在,某种意义上来说,异质性变量的定义和调节变量具有一定的相似之处,因此异质性分析和调节分析采用加入交互项的做法是相同的逻辑,对于异质性变量的选择和调节变量的选择可以使用同样的逻辑(详情见实证研究干货专题五)。需要补充的是,异质性变量不要选择自变量或者因变量,因为这并不是异质性分析,而是讨论因果关系的影响程度,也不要选择控制变量作为异质性变量,因为这是讨论其他控制因素的变化造成的内生性干扰,异质性变量的选择应该以客观存在、相对外生、现实中具有明显的意义为基础。

04


异质性分析的目的:如何更好展现异质性

异质性分析的根本目的是找出因果关系中客观存在的差异,如果研究的故事本身就不存在异质性,那么分析异质性就没有必要。异质性分析要以现实问题为依据,根据现实中客观存在的现象进行异质性分析,找出因果关系的差异,让研究结论更加全面科学,这是异质性分析的核心。我们不必为了异质性而进行异质性分析,也不必为了充实内容进行异质性分析,而是要秉持科学规范的标准,为了让结论更加符合现实情况而进行异质性分析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多