(1)时间序列数据中的自相关:由于经济活动通常具有某种连续性或持久性,自相关现象在时间序列中比较常见。如相邻两年的GDP增长率、通货膨胀率。 又比如,某个意外事件或新政策的效应(私募基金监管的八条底线、“3+3”的合格私募投顾条件等对私募行业的影响)需要逐步地随时间释放出来。 (2)截面数据中的自相关:一般来说,截面数据不容易出现自相关,但相邻的观测单位之间也可能存在“溢出效应”,这种自相关也称为“空间自相关”。 比如,相邻地区的农业产量受到类似天气变化的影响;同一社区内的房屋价格存在相关性;同一个投顾下的同策略不同基金业绩存在相关性。 (3)对数据的人为处理:如果数据中包含移动平均数、内插值或季节调整时,则从理论上即可判断存在自相关。 例如,对于私募基金信披不规范问题,通常对于缺失值进行替代法或几何插值法处理,可能导致基金的净值或收益率存在更强的自相关性。需要注意的是,统计局提供的某些数据可能已经事先经过了这些人为处理。 (4)设定误差:如果模型设定中遗漏了某个自相关的解释变量,并被纳入到扰动项中,则会引起扰动项的自相关性。这种由于设定误差而导致的自相关,即便在截面数据中也可能存在。 例如,通常在基金行业或股票市场的CAPM模型中的扰动项就存在自相关性,于是便产生的多因子模型选股和多因子模型选基的方式,其目的无非是为了挖出更多的解释变量,缓解由于设定误差而导致的自相关问题,进行更准确的alpha提纯和业绩归因等。 分布。如果原假设成立,LM统计量的值将很小,小于临界值。 |
|