2021年4月20日,Stata 公司正式宣布Stata 17上线啦! 或许计量小伙伴们还没把Stata 16捂热,Stata公司就高效地推出了Stata 17。工欲善其事,必先利其器。而Stata公司正如“有匪君子,如切如磋,如琢如磨”,把Stata这把利器打造得日益精良与称手。 Stata之所以能成为最流行的计量经济学软件,根本原因在于Stata十分贴近计量经济学的实践应用。那么,全新的Stata 17给我们带来了怎样的惊喜呢?总结起来,主要有以下十个方面,下面分别介绍: 1、双重差分法的官方命令 2、完美的表格输出 3、Lasso的新功能 4、离散选择模型的新命令 5、久期数据的新命令 6、贝叶斯计量经济学的全面升级 7、非参数的趋势检验 8、元分析的新命令 9、Stata与Python、Java、H2O 及 Jupyter Notebook的整合 10、Do文件编辑器的改进与Stata速度提升等 1、双重差分法的官方命令 “双重差分法”(Difference-in-differences,简记DID)或许是最常用的计量方法。怎么能没有DID的Stata官方命令呢?为此,Stata 17及时地推出了DID的官方命令xtdidregress;其中,“xt” 表示这是适用于面板数据的命令。 除了进行常规的 DID 估计,命令xtdidregress还允许最多指定三个“分组变量”(group variables),或两个分组变量与一个时间变量,从而进行“三重差分法”(Difference-in-differences-in-differences,简记DDD)的估计。 另外,针对“重复截面数据”(repeated cross-sectional data),即所谓“准面板”(pseudo panel data),Stata 17也推出了相关的新命令didregress,可进行类似 DID 的估计。 更重要的是,你可以用DID的官方命令,轻松地画平行趋势图啦~ 2、完美的表格输出 实证研究者经常需要将Stata的多个回归结果以表格形式输出到Word文件中。虽然早有官方命令estimates table可完成此类任务,但比较死板;故此前Stata用户一般使用非官方命令(比如estout或outreg)来输出回归结果。为此,Stata 17大幅改善了原来的table命令,使用户可轻松地以表格形式汇报回归结果(regression results)或统计特征(summary statistics)。 进一步,你可以设计回归表格的风格(styles),并应用于所创建的表格,然后将此表格输出到Word或其他形式的文件(包括PDF、HTML、LaTex、Excel、Markdown 等)。另外,你还可以使用新增的前缀(prefix)collect,来收集Stata命令的各种估计结果。最后,Stata 17还新增了Table Builder(表格创建器),让用户可通过点击鼠标(point-and-click)来创建表格。 3、Lasso的新功能 作为“高维回归”(high-dimensional regression)的常用工具,Stata 16已经推出了有关Lasso(Least Absolute Shrinkage and Selection Operator,即所谓 “套索估计量”)的一系列官方命令。Stata 17则提供了更多有关 Lasso 的新功能。
4、离散选择模型的新命令 离散选择模型(discrete choice model)是微观计量经济学的常用模型。在Stata 17中,增加了以下离散选择模型的新命令:
5、久期数据的新命令 “久期数据”(duration data)常用于生物统计的 “生存分析”(survival analysis),在经济学中也有广泛用途,例如失业的持续时间,婚姻的延续时长,王朝的寿命等。久期数据常存在 “删失”(censoring)或 “归并” 问题,比如当研究结束时,有些病人可能尚未死亡;或者有些失业者还未找到工作。 Stata 17新推出的命令stintcox,可使用Cox模型来估计一种特殊的“区间删失”(interval-censored)数据。对于区间删失数据,我们只知道事件发生于某个区间,但无法确知其发生时点;比如,只知道癌症复发于两次体检之间的时段。如果忽略久期数据存在的区间删失问题,则会导致估计偏差。 6、贝叶斯计量经济学的全面升级 在大数据时代,由于数据日益复杂而多样,在处理有些问题时,基于频率学派的传统计量方法可能不便使用,使得贝叶斯学派的计量经济学逐渐兴起。频率学派认为待估计的参数是给定的未知数(fixed unknown parameters),而贝叶斯学派则将未知参数视为服从某个分布的随机变量,并可随时根据新的样本信息将其 “先验分布”(prior distribution)更新为 “后验分布”(posterior distribution)。 Stata 17将Stata中原有的贝叶斯统计学与计量经济学进行了全面升级。
使用贝叶斯方法估计VAR模型有两大好处。首先,VAR模型通常包含较多参数,若样本较小,则估计结果不稳定。而贝叶斯方法由于较易“整合先验信息”(incorporating prior information),故在用小样本估计VAR模型时更为稳健。
7、非参数的趋势检验 有时样本数据中存在分组(比如,分为3组),且这些分组有天然的排序(比如,记为1,2,3组),即所谓 “排序分组”(ordered groups)。在这种排序分组的数据中,经常希望检验某个变量在此分组排序中(比如,第1-3组),是否存在某种趋势,比如此变量的取值倾向于越来越大,即所谓 “tests for trend across ordered group”。 为此,可使用Stata已有命令nptrend,进行非参数的Cuzick秩检验(Cuzick test using ranks)。而Stata 17的最新版nptrend命令,则在 Cuzick秩检验之外,新增了三个非参数检验,即“Cochran-Armitage test”,“Jonckheere-Terpstra test” 与“linear-by-linear trend test”,使得命令nptrend的功能大大增强。 8、元分析的新命令 “元分析”(meta-analysis)将多个类似的研究结果综合在一起。比如,针对某个疫苗的有效性(vaccine efficacy),在世界各地进行了多个实验,如何将每个实验所得的疫苗有效性指标,通过加权平均得到统一的度量。Stata 17将Stata的元分析功能作了进一步的提升。
9、Stata与Python、Java、H2O及Jupyter Notebook的整合 在大数据时代,Stata也在加快与主流软件平台的整合,为用户提供更多的增值服务。这在Stata 17的此次升级中体现尤其突出。
10、Do文件编辑器的改进与Stata速度提升等
总之,Stata 17是一次令人激动的重大升级,不仅有贝叶斯计量经济学的高歌猛进,与主流计算机语言平台的深度整合,更便于编程的Do文件编辑器,而且更为贴近计量实战的需求(DID,表格输出,离散选择等)。显然,在可预见的将来,Stata 依然会是经管社科的首选计量与统计软件。 |
|