分享

【BMJ子刊的Stata教程】用Stata进行Meta分析的实践教程

 计量经济圈 2022-09-03 发布于浙江
Image
Image

摘要

通过Meta分析对研究结果进行统计综合,被广泛用于评估相互竞争的干预措施的相对有效性。最近,本刊发表了三篇系列论文,旨在让心理健康科学家熟悉Meta分析中的关键统计概念和问题。其中一篇论文侧重于选择和解释合适的模型来综合结果(固定效应或随机效应模型),而另外两篇论文则侧重于影响Meta分析结果有效性的两个主要威胁,即发表偏倚和结果数据缺失。在本文中,我们就如何使用Stata(最常用的Meta分析软件包之一)进行Meta分析提供指导。我们讨论了本刊前几期所涉及的三个主题,重点是利用心理健康研究中的一个工作实例在Stata中实现这些主题。

引言

系统回顾和Meta分析通常被认为是一种可靠的证据来源,可以为有关竞争性干预措施的有效性和安全性的决策提供信息。Meta分析结果的有效性取决于几个因素,如系统回顾的完整性、所做假设的合理性、个别研究的偏倚风险和报告偏倚的可能性。在本文中,我们重点讨论了Meta分析过程中涉及的统计学考虑因素,并在Stata中分析了一个来自精神健康的例子。我们实施的方法的理论和概念考虑已经在最近发表的文章中有所涉及,我们建议在阅读本稿时将这些论文作为伴奏。更具体地说,在本文中我们提出了Stata命令。

1进行固定或随机效应Meta分析。在进行统计分析之前,Meta分析者应考虑为特定的临床环境和感兴趣的结果建立适当的模型(固定效应或随机效应),然后根据研究间变异性(异质性)的大小来解释结果。

2解释缺失的结果数据。结果数据缺失的参与者可能会影响Meta分析总结效果的精确度和大小;当缺失的概率与被比较的干预措施的有效性有关时,就会出现后者。

3如果不考虑未发表的研究,可能会导致汇总估计值偏向于两种竞争性治疗方法中的一种(即通常是积极的或较新的干预措施)。

方法和Stata程序

在下面的章节中

1我们提供了一个使用metan命令进行固定和随机效应Meta分析的例子。

2我们使用metamiss命令来探讨关于数据缺失机制的不同假设对总结效应的影响。

3我们使用metafunnelconfunnelmetatrimmetabias等命令,采用不同的方法和工具来评估是否可能出现发表偏倚。

作为一个工作例子,我们使用了一个系统回顾,其中包括17项比较氟哌啶醇和安慰剂治疗精神分裂症症状的试验。这个数据集以前曾被用来评估数据缺失对临床结果的影响,而且最初是基于Cochrane综述。感兴趣的结果是临床改善,风险比(RRs)大于1,有利于氟哌啶醇而不是安慰剂。从每个试验中,我们得到了以下信息(表1)。

Image

1安慰剂组(变量rp)和氟哌啶醇组(rh)中有反应的参与者人数。

2在两组中都没有反应的参与者人数(fp, fh)。

3退出和结果缺失的参与者人数(mp, mh)。

执行固定和随机效应Meta分析和测量异质性

Stata中的Meta分析可以使用metan命令进行。

对于二分法数据,metan命令需要四个输入变量。

. metan rh fh rp fp

输入这个命令后,软件会根据Mantel-Haenszel权重,使用固定效应模型给出氟哌啶醇与安慰剂的RR汇总。通过指定OR的选项or和风险差异的选项rd,可以改变估计的效应大小。选项by()可以为纳入的研究定义一个分组变量,并运行一个亚组分析。

对于连续数据,需要六个输入变量:每组参与者的总数,每组的平均值和SD。选项nostandard将估计的效应测量从标准化的平均差异转换为平均差异。

该命令通过Q检验、I2测量和异质性方差τ2的估计(使用矩量法估计)给出了统计异质性的存在和大小的信息,这些都在输出结果中提供。尽管估计的I2τ2通常被报告为固定值,但它们并非不存在围绕平均估计值的不确定性。I2度量的CI可以通过heterogi命令得出,它需要输入Meta分析Q统计量和相应的自由度(df,研究数量减去1)。

. heterogi Q df(Q)

到目前为止,metan命令还没有提供异质性(τ2)大小的CI。然而,它可以通过预测区间来评估异质性对总结效应的影响,预测区间是指未来研究的效应预计在哪个区间内。预测区间表达了由于异质性引起的未来研究估计的额外不确定性,可以通过添加metan中的rfdist选项来估计(在随机效应模型下)。

还有许多额外的选项(例如,处理森林图外观的选项),可以在命令的帮助文件中找到(输入 'help metan')。

探讨结果数据缺失的影响

Stata有一个现成的metamiss命令,可以在Meta分析中对结果数据缺失的机制进行不同的假设。迄今为止,metamiss命令只适用于二分法数据,但目前正在扩展,以考虑连续结果该文发表时间是2014年,现在应该有了语法与metan命令相似,但也需要每组退出的参与者人数(即需要六个输入变量),以及所需的缺失数据的信息归入方法。

. metamiss rh fh mh rp fp mp, imputation_method

一般来说,我们可以假设以下情况。

1可用availble case analysisACA),忽略缺失数据(选项aca),证明随机缺失的假设是合理的。

2最好的情况,即把实验组中所有缺失的参与者作为成功者,把对照组中的参与者作为失败者进行归纳(选项icab)。

3最坏的情况,与最好的情况相反(选项icaw)。

前面的两种方法是天真的归因方法,因为它们没有适当考虑到归因的缺失数据的不确定性。考虑到推算数据的不确定性的方法包括。

1Gamble-Hollis analysis它利用最佳情况和最差情况的分析结果来扩大研究的不确定性(option gamblehollis)。

2information missing OR (IMOR) model,该模型在每个研究组内将观察到的和缺失的参与者的结果联系起来(选项imor () logimor ()),允许假设关联的不确定性(sdlogimor ())。

注意metamiss命令总是假设结果是有益的;因此对于有害的结果(如不良事件),选项icabicaw将分别给出最坏情况和最好情况。如果不可能假设缺失的数据是随机缺失的,那么IMOR模型是最合适的方法,因为它考虑到了推算数据的不确定性。如果这个参数不能被专家意见所告知,那么谨慎的做法是进行敏感性分析,假设各种数值(例如,如果我们将缺失数据中结果的几率设定为治疗组和对照组观察数据中几率的两倍,我们就输入metamiss rh fh mh rp fp mp, imor (2))。

评估小研究效应的存在和发表偏倚的风险

评估Meta分析中发表偏倚风险的现有方法可大致分为两类:(1)基于将效应大小与其精确度相关联的方法;(2)选择模型。我们重点讨论第一类方法,这些方法已经通过metafunnelconfunnelmetatrimmetabias等命令在Stata中实现。然而,研究人员应该始终记住,这种方法提供的是关于小研究效应的信息,这些效应可能与真正的出版偏倚有关,也可能无关。

命令metafunnel绘制标准漏斗图,需要两个输入变量。让logRRselogRR成为两个变量,包含研究中观察到的效应大小和它们的SEmetafunnel命令的语法为。

. metafunnel logRR selogRR

可以添加选项by(),以根据分组变量在子组中显示研究(使用不同的形状和颜色)。标准漏斗图的局限性在于,它不能解释明显的不对称性是由于出版偏倚还是其他原因,如大小研究之间真正的异质性或参与者基线风险的差异。可以使用轮廓增强的漏斗图,在图中添加阴影区域,以表明缺失的研究是否位于统计学意义的区域(例如,P<0.05)。可以使用与metafunnel命令相同的语法来制作这种修正的漏斗图。

. confunnel logRR selogRR

通过选项metric ()可以修改纵轴上绘制的研究精度测量值(例如,用方差代替SE),而选项extraplot ()允许使用标准的Stata命令加入额外的图形(如回归线、替代散点图等)。

漏斗图的替代品也已在Stata中实现。更具体地说,认为试验中效果的大小与精度有关的回归模型非常流行。命令metabias可以拟合四种不同的回归模型;它们是Egger检验(选项egger)、Harbord检验(选项harbord)、Peter检验(选项peter)以及BeggMazumdar的等级相关检验(选项begg)。对于研究效果大小(effect)回归到其标准误差(se)的通用方法来说

. metabias effect se, model

或者对于二分法的数据

. metabias rh fh rp fp, model

其中模型定义了上述四个模型之一。添加选项graph也给出了结果的图形描述。请注意,通过Egger检验估计的回归线也可以通过在metafunnel命令中添加选项egger加入到漏斗图中。

剪补和填充方法的目的是在假设发表偏倚是不对称的唯一解释的情况下,估计漏斗图的总结效应。该方法可以通过metatrim命令应用,其语法如下。

. metatrim effect se

metatrim中指定选项funnel可以得到估计的填充漏斗图,包括已发表和未发表的研究。

结果

产生下面描述的所有结果的Stata脚本可以在网上找到:

http://missoptima.project./index.php/our-research-projects

固定和随机效应Meta分析

为了说明问题,我们拟合了固定效应和随机效应模型。使用metan命令,我们对两个模型进行了ACA,并产生了1的森林图。在解释随机效应Meta分析的结果时,关注菱形通常会产生误导;例如,在存在过度异质性的情况下,菱形往往没有意义。

Image

根据1,两个模型都表明,氟哌啶醇在统计学上比安慰剂治疗精神分裂症更有效,而且正如预期的那样,随机效应分析产生了更宽的CI。尽管有这一发现,估计的预测区间还是越过了无效应线,这意味着在未来的研究中,安慰剂可能比活性药物更有效。特定研究的估计值似乎有很大的异质性(例如,以下研究的CIsBechelli Beasley 没有重叠);因此,固定效应假设对这个数据集来说可能是不可靠的。这一点得到了Q检验的支持,该检验表明存在异质性(P=0.038)。衡量各研究间异质性大小的I2指标的平均值表明存在低异质性(41%)。使用heterogi命令,我们估计了I2CI,其范围从0%67%,意味着异质性有可能是无效的,但不是过度的。

这两个模型不仅在不确定性水平上有差异,而且在总结效应的大小方面也有差异。这在存在小研究效应(即效应大小与研究规模之间存在关联)时非常常见,因为随机效应模型给小研究分配的权重相对较大。事实上,在我们的例子中,小研究(即1中小方块对应的研究)给氟哌啶醇带来更有利的结果,而大研究则更接近无效效应。

缺少结果数据的影响

我们首先进行了亚组分析(使用metanby()选项),以调查有和没有缺失数据的研究(两组)是否产生了不同结果。该分析仅基于观察到的数据,因此,在数据缺失的研究中,样本量小于随机参与者的数量。关于亚组分析的一个常见误解是,当一个亚组的汇总效应具有统计学意义而另一个亚组不具有统计学意义时,亚组之间的结果就不同。然而,对亚组差异的推断应基于交互检验(即RevMan-http://tech./revman中也实施的亚组差异检验),对两个亚组平均值进行统计学比较,并考虑其不确定性。亚组之间的差异也可以通过观察其汇总估计的CIs的重叠来直观地识别。

2中,没有缺失数据的试验比有缺失数据的试验对氟哌啶醇给出了更有利的结果。这种差异在统计学上也是有意义的,因为亚组间异质性的总体检验的p值(在固定效应模型下metan的输出中提供)等于0.001。因此,试验中的数据缺失很可能大大影响了结果;一个可能的解释是,由于缺乏疗效,安慰剂组的退出率很高,这在精神病学的试验中相当常见。

Image

我们通过在分析中加入关于缺失机制的不同假设,进一步探讨了缺失数据的影响。我们介绍了随机效应模型的结果(3),并着重介绍了不同情况下的汇总效应的差异。在所有六个分析中,氟哌啶醇对精神分裂症的疗效似乎比安慰剂更好。与ACA相比,IMOR模型和Gable-Hollis分析的点估计值存在微小差异。与其他方法不同的是,这两种方法没有估算数据,也没有人为地扩大样本量。IMOR模型增加了研究内部的不确定性,这反过来又导致了异质性的轻微降低。总结估计的变化可以忽略不计。在ACA分析中,缺失率高的研究有利于安慰剂(1)。IMOR模型降低了这些研究的权重,平均汇总估计值略微向主动干预方向移动。

Image

发表偏倚和小研究效应

固定效应模型和随机效应模型之间不同的摘要估计(1)引起了人们的关注,即小研究效应可能在我们的例子中起作用,对总体效应的正确解释提出了质疑。为了探讨效应大小与研究规模之间的明显联系,我们采用了一系列的图形方法和统计测试(需要注意的是,所有这些方法的力量都很低,至少需要10项研究才能得出结论)。

4中的漏斗图是相当不对称的,显示较小的研究倾向于给出强调氟哌啶醇有效性的结果。等高线增强的漏斗图(5)帮助我们区分了发表偏倚和其他导致不对称的原因。它显示,小的研究不仅出现在具有统计学意义的区域(阴影区域),也出现在不具有统计学意义的区域(白色区域);因此,不对称性可能是由几个因素造成的,而不仅仅是由发表偏倚。为了评估观察到的效应大小与研究样本之间关系的大小和统计意义,我们运行了EggerMeta回归模型(2)。检验结果表明,如果与大型试验相比,较小的研究往往会给出不同的结果,因为截距的CI不包括零值。

Image
Image
Image

我们最后应用了修剪和填充的方法,尽管漏斗图不对称完全是由发表偏倚引起的假设对这个数据集可能不成立。加入9个估计的未发表研究后,固定效应模型的汇总估计值略微接近于0(图6),而随机效应模型(表3)的汇总估计值不明显(p=0.083)。

Image

讨论

伴随着Meta分析方法的快速发展,各种相关的软件选择已经出现,可以应用不同的模型和探索可能影响结果的特征。在本文中,我们用一个工作实例向研究人员和感兴趣的临床医生提供了一个关于在Meta分析中使用Stata的简要教程,强调了在解释结果时常见的陷阱(关于Stata的更多信息可以在其他地方找到)。我们的发现表明,一些试验中存在重要的小研究效应以及结果数据的缺失,使得估计的总结效应不能代表整个研究。Meta分析中只包括有所有随机参与者数据的研究并不是推荐的方法,因为大部分的证据来自于结果数据缺失的试验。

对感兴趣的结果和治疗的临床洞察力是必要的,以便对缺失数据的机制做出合理的假设,并为选择适当的统计模型提供信息。考虑到归因于缺失数据的不确定性的三个模型(Gamble-Hollis和两个IMOR模型)的结果是相似的,可能是对汇总RR的最准确估计。然而,小型和大型试验给出不同的结果这一事实需要进一步探讨。例如,如果研究的规模与某些效应修饰物的人群特征差异有关,那么可能就没有一个适用于所有人群的共同RR

Image

PS:学术成绩有限,在一些方面可能会存在错误,欢迎大家即时指正和批评!

Image

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多