分享

SPSS之1:n倾向性得分匹配

 Memo_Cleon 2021-04-05

转自个人微信公众号【Memo_Cleon】的统计学习笔记:SPSS之1:n倾向性得分匹配

前面我们已经有两篇推文介绍过倾向性得分匹配(倾向值匹配),一篇是采用SPSS进行1:1的PSM,另外一篇采用的是R的MatchIt包来实现。SPSS操作简便,但目前尚不支持1:n的PSM,也不能直接对匹配后的数据进行平衡性分析,安装R插件后这些问题都会得到解决,安装教程可参考《PS Matching安装攻略》。本次笔记的操作需要成功安装PS Matching插件。

在进行倾向值分析分析过程中,有几个问题关键问题需要了解一下。
(1)匹配方法。倾向值匹配用到的具体方法有很多,比如最邻近匹配(nearest neighbor matching)、卡钳匹配(caliper matching)、精确匹配(Exact Matching)、最优匹配(Optimal Matching)、完全匹配(Full Matching)。最邻近匹配是从暴露组(或干预组、处理组)的第一个研究对象开始在对照组中寻找倾向值(propensity score,PS)与其最接近的个体进行配对,直至暴露组所有个体找到对象。我们在前面两篇推文中使用到的卡钳匹配,实际上就是在最临近匹配的基础上加一个限制条件,即要求暴露/干预组与对照个体间的倾向值差值在事先设定的某范围内才能进行匹配。精确匹配要求匹配对象具有相同的协变量值。最优匹配(Optimal Matching,或称最优成对匹配Optimal pair matching)和完全匹配(Full Matching,或称最优完全匹配Optimal full matching)不求单个匹配最好,但整体上更好,最优匹配要去每个暴露组对象与单个对照组对象相匹配,完全匹配则可以每个暴露组对象与一个或多个对照组,或者每个对照组对象与一个或多个暴露组对象相匹配。另外还有一些其他的匹配算法,比如遗传匹配(Genetic Matching)、粗度精确匹配(Coarsened Exact Matching)、子类匹配(Subclassification)。匹配指标除了倾向值外,还有马氏距离、病例对照按各个因素直接匹配等。
(2)倾向值模型变量的选择。倾向值是在给定协变量的条件下,研究对象被分配到处理组的概率。常通过倾向值模型来获得,一般采用logistic回归或者Probit回归。在建立倾向值模型时,应该纳入哪些变量呢?全部协变量?与暴露因素和结局都有关的协变量(即混杂因素)?与结局有关的变量?还是与暴露和结局都无关的变量?研究表明模型纳入与处理无关而与结局有关的变量,可以增加估计处理效应的精度,同时不会增加偏倚最优倾向值模型是纳入所有与结局有关的变量,而不管其是否与暴露因素有关。哪些是相关因素应根据专业知识而定,一种可以考虑的办法是将结局变量与协变量构建二分类的logistic模型进行逐步回归,进入模型的变量作为PS模型的自变量。注意此处构建的模型因变量是结局变量,而不是在构建PS模型时的暴露/干预因素,如果以暴露/干预因素为因变量来进行过logistic逐步回归筛选,纳入的变量再多,最终筛选到的都是与暴露因素相关的因素,其与结局变量相关或不相关是不知道的,PS模型纳入与处理有关而与结果无关的变量不会降低偏倚,而且会降低估计处理效应的精度
(3)匹配后数据集的组间均衡性分析。倾向值匹配只是数据的处理过程,获得匹配集后还需要再次对协变量在处理组和对照组的均衡性进行验证,在均衡的前提下才能考察干预的作用。很多文章对匹配数据的组间协变量均衡性检验采用的是假设检验的方法,我们在《倾向性得分匹配(SPSS)》、《倾向性得分匹配(R:MatchIt)》、《病例对照匹配》中对匹配后的数据就是采用这种方法对均衡性进行分析。但这样做有值得商榷的地方。倾向性匹配数据集是从代表总体的样本的再抽样,是样本中的样本,而假设检验对应的是样本所在的总体,另外倾向性匹配后的数据样本量减少本就会导致P值变大。基于这两点,有些研究并不采用假设检验来验证匹配后的均衡性,而是采用标准化均数差异standardized mean difference),PS Matching插件中提供该指标的多种验证方法。有些研究会同时提供标准差异和假设检验的结果。
(4)处理效应的估计。数据匹配前,干预组和对照组间的比较我们一般按照两个独立样本来处理,在经过匹配之后,一种观点认为协变量在干预/暴露组和对照组间分布均衡,个体之间有配对特征,两组间不再独立,因此匹配后的组间比较应考虑到样本的配对特征,还有一种观点倾向值分析毕竟是在结局已定情况下的校正,与试验前的配对不同,考虑到两配对样本更高的分析效率,为不增加假阳性错误,按两独立样本的设计进行分析结果会更为稳健一些。
(5)回放(replacement)。允许放回就是允许在匹配过程中重复利用对照,这样可以增大匹配数据集,倾向值总体差异也会变小,其缺点也很明显,由于对照组内包含了重复的个体,缺乏缺乏独立性,采用什么方法就存在争议。因此一般都不允许回放。

示例仍然采用《倾向性得分匹配》的数据:考察孕期妇女吸烟对新生儿体重的影响的观察性研究。暴露为吸烟(mbsmoke),结局变量为是否出现低体重新生儿(lbweight),本次笔记仅考虑孕母年龄(mage)、是否白人(mrace)、婚姻状况(mmarried)、孕期是否饮酒(alcohol)以及父亲的年龄(fage)和是否白人(frace)几个协变量。

【1】基线评估:
结果表明几个协变量在组间均衡性较差,即这几个协变量在暴露和对照组间存在统计学差异。

【2】倾向性匹配:Analyze >> PS Matching

 l 匹配算法:提供了最邻近匹配、完全匹配和优化匹配。本例默认最邻近算法;

l 舍弃共同支持域外单位:对重叠域外的观察对象的处理方式,包括不处理、处理组和对照组均舍弃、舍弃处理组、舍弃对照组;

l 估计算法:默认logistic回归;

l 二分类治疗指示因子(0代表对照组,1代表处理组):变量类型务必为尺度变量。本例选入mbsmoke,原变量尺度为名义变量,需要改为尺度变量;

l 协变量:选入需要匹配的变量,本例选入所有的协变量:孕母年龄(mage)、种族(mrace)、婚姻状况(mmarried)、是否吸烟(mbsmoke)、孕期是否饮酒(alcohol)、父亲的年龄(fage)和是否白人(frace);

l 附加协变量:可选入与结局变量无关但需要平衡的变量。以结局变量为因变量,以协变量为解释变量进行的逐步回归结果,进入模型的变量选入协变量,未进入模型的变量选入附加协变量框,本例未按此法操作,感兴趣者可以尝试;

l 精确匹配:依据选入的变量对个体进行精确匹配,仅适用于最邻近匹配;

l 卡钳值:取值范围0-1,值越小匹配越严格符合要求的匹配集越小,默认取值0.2。

【绘图和输出】

绘图:可输出倾向值直方图、个案抖动散点图、标准化差异直方图、各协变量标准化均数差异散点图、各协变量匹配前后标准化均数差异变化线图,图片可选择96~400PPI的分辨率。

输出数据集:可选择[带有倾向值的原始数据集]或者[通过新生成变量“matched_id”来标识的配对数据集],数据集可以包括所有个案,或者只保留匹配的个案。新生成数据集内容如下表所示。本例选择“Paired dataset by “matched_id”&“Matched cases”。

平衡性统计量:基本和详细两种,另外可选择是否包含交互作用。本例不考虑交互作用。

【最邻近匹配选项】

亚分类:可选择是否按照倾向值接近程度分为若干亚分类进行分析,可以通过处理组、对照组或所有个案来进行分类;

匹配比率:默认处理组和对照组进行1:1匹配,也可以进行1:n进行匹配。本例设置为1:2;

匹配顺序:当出现多个满足匹配条件的个案时,有从最大倾向值开始匹配、从最小倾向值开始匹配、随机匹配三种方式。本例默认从最大值开始;

本例不允许回放(replacement)。

【3】倾向性值匹配结果

(1)样本匹配概况:原数据对照组3778例,治疗组864例,经过倾向值匹配后获得的数据集中处理组841例,对照组1567例,治疗组和对照组并非刚好是1:2,这是由于有病例组未能找到匹配对象所致;未能匹配成功的病例中治疗组23例,对照组2199例;有12例对照组病例不再共同支持域被舍弃掉。 

(2)平衡性检验

(2.1)Hansen&Bowers全局平衡性检验:P>0.05表示协变量和附加协变量框中的变量在两组间整体均衡性良好,但只适用于1:1匹配且数据不能回放,本例按1:2进行匹配,因此该法不能给出结果。 

(2.2)相对多变量不平衡L1检验:L1值取值范围0-1,匹配后的值越小匹配效果越好。该例匹配后的值变小,表示匹配对平衡性有改善。

 

(2.3)不平衡协变量概况,若出现|d|>0.25的变量则提示该变量存在不均衡性,且会按照|d|大小从上到下给出。|d|即标准化均数差异(standardized mean difference)。本例未出现|d|>0.25的变量,可认为匹配后各变量在组间达到了均衡。 

(2.4)各变量的平衡性详情,给出倾向值和各变量在匹配前后处理组均值、对照组均值、对照组各变量的标准差、标准化均数差。|标准化均数差|<0.1,则组间均衡性良好,|标准化均数差|>0.25则组间均衡性较差了。本例匹配后各变量标准化均数差绝对值均小于0.1,组间均衡性良好。 

对于标准差异,除了上述表格直接给出了具体的数值,后面也给出了标准化差异的几种图示法结果,如各变量的标准化差异的变化线图(lineplot)、直方图(histogram)以及散点图(loveplot),见后面的(2.6)、(2.8)、(2.9)。

(2.5)个案抖动散点图,显示倾向值的分布。本例处理组和对照组的重叠性较好,虽然处理组还有一些未能匹配的对象,但是获得两组匹配个体的倾向值都比较接近,匹配效果还是不错的。该图中对照组匹配对象的圈点要比处理组大,是因为在该图中圈点的大小表示权重,本例处理组:对照组采用的比率是1:2,因此对照组的点比较大。

(2.6)标准差异变化线图,用线图来表示各个变量匹配前后标准化均数差异绝对值变化。本例各个变量的标准差异均明显降低,匹配对数据的平衡有改善。

(2.7)倾向值的分布直方图。提供未匹配和匹配后倾向值的相似度,并提供共同支持域的密度函数曲线,匹配后处理组和对照分布近似提示匹配良好。

(2.8)匹配前后标准差异直方图,提供匹配前后标准化均数差异的直方图即密度曲线。匹配后的标准化差异集中在0附近,提示不再存在系统差异。 

(2.9)loveplot,即各协变量标准化均数差异散点图,该图能够明显看出匹配前后均衡性发生的改变。各协变量匹配前后的标准化差异,若匹配后变量对应点落-0.25~0.25之间,则示变量达到均衡。

有的研究对匹配后数据均衡性研究采用的是假设检验分析,这个我们在本文的开始已经提到过。假设检验结果显示是否饮酒在组间依旧不平衡。我们可以缩小卡钳值重新对原始数据进行匹配,实际上当卡钳值设置为0.1时,饮酒在组间达到平衡,感兴趣的可以自行操作。

【4】暴露因素作用评估:孕期吸烟能够影响新生儿的体重。

两独立样本的卡方分析:Chi2=19.784,P<0.001,OR=1.810;

考虑配对的单因素条件logistic回归:wald chi2=15.346,P<0.001,进行多因素校正wald chi2=21.841,P<0.001,RR=2.252。

参考文献

王永吉等.中华流行病学杂志,2010,31(7).

黄福强等.J south Med Univ,2015,35(11).

Yoon Kong Loke et al.Diabetes Obes Metab. 2020;22(Suppl. 3).

转自个人微信公众号【Memo_Cleon】的统计学习笔记:SPSS之1:n倾向性得分匹配

END

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多