AI 投资言过其实

东西二王 2019-09-19

展开全文

1 狂热的 AI 浪潮

近几年随着深度学习算法的出现，人工智能（AI）技术的热潮在全球各领域铺展开来。之前一些计算机处理起来非常困难的任务，依赖深度学习算法，得到了很好的解决。在很多特定数据集、特定任务中，计算机已经达到甚至超过了人类的水平。AlphaGo 在围棋上击败人类把这波浪潮推向了一个新的高峰，人们纷纷对于 AI 的发展无比乐观，似乎很快 AI 就要全面取代人类。

AI 投资言过其实

这狂热的一幕在 AI 历史上已经出现过几次，早在上世纪 60 年代，AI 刚刚被提出时，乐观的从业者就认为 AI 将很快在国际象棋和语言翻译中击败人类。90 年代深蓝在国际象棋中击败了人类，日前 AlphaGo 又拿下了更为复杂的围棋，但语言翻译到目前为止 AI 仍然与人类有较大差距。

现在 AI 的旋风又刮到了投资领域，AI 投资进入市场，颇有联合收割机进场割韭菜之势。AI 是否真的如此神奇？事实上目前以深度学习为代表的 AI 技术还有着非常大的局限性，AI 的一些核心问题仍未解决，AI 未来的路还很长。而投资任务的复杂性远远超出了目前 AI 能够很好处理的范围。现阶段说 AI 投资将要甚至已经击败了人类，有些言过其实了。

2 AI 擅长的任务

为什么棋类游戏最先被 AI 攻克？我们来看棋类游戏的特点：

信息边界明确，状态有限；
所有信息完全公开透明；
游戏在有限步内结束，有明确的胜负判断标准。

这几点造成了棋类游戏的的整个状态空间是有限确定的。以围棋为例，每个交叉点上无非就是黑子/白子/空三种状态，再加上整个局面轮黑棋或白棋先行，满打满算一共也就 3^361 × 2 种局面，之外的任何信息都对策略没有影响。当然，以目前的技术列出围棋的全部局面是不可想象的，但是计算机相较于人的长处正是海量数据的存储与高速运算。因此计算机在棋类游戏中击败人类就不足为奇了。

再看投资领域，与围棋相比在上述几个特点上都显著的更为复杂。与围棋的全部信息都在棋盘之中相比，对于投资你很难预先确定整个问题的信息边界。这对于现阶段的 AI 已经构成了天大的挑战。现在的 AI 从技术以及形态上显然无法像人类一样主动去现实世界探索信息，那么如果让 AI 去投资，整个系统的输入是什么？哪些信息是相关的哪些信息是无关的？对于投资这种开放性问题，大千世界的任何信息都有可能会对决策产生影响，信息量巨大而信噪比极低。AI 不可能获取到一切有可能有意义的信息，从目前常见的做法来看，除了各类报表数据，无非就是接入互联网，从新闻以及舆论中挖掘一些有意义的信息。但这远非投资需要了解的全部，反而引入了大量的垃圾噪音。

AI 投资言过其实

如上图所示，AI 能够使用的信息实际只是现实世界全部信息一小部分，其中还包含了大量的无用噪音甚至是虚假、错误信息。在这样的数据基础上，无论使用多么先进的算法，也无异于盲人摸象，难以获得令人满意的结果。

另外棋类游戏有确定的结束标志，存在明确的胜负标准，这也对 AI 的学习提供了极大的便利。最新的 AlphaGo Zero 版本正是依赖于此，让程序从 0 开始，不断的自我对弈以提升棋力。其背后唯一的逻辑很简单：一盘下完了，赢棋方的着法总是比输棋方走得好。这其实是一类非常特殊的问题。深入分析一下，围棋 AI 希望尽可能的提高棋力，而对弈胜负正是棋力真实客观的外在量化标准，可以直接测量、反馈。作为 AI 只需要不断地追求胜利即可，这个量化目标与根本目的是完全一致的。同样的事情放在投资上就不那么显然了。选出中国平安的策略比较厉害？还是选出贵州茅台的策略比较厉害？我们希望尽可能的提高 AI 的投资能力，但是这个投资能力缺乏一个明确的可量化评测标准。我们只能利用唯一的历史数据，使用类似“近十年的投资信息比率”、“近五年的收益率”等代理指标。但是我们应当清醒的认识到，这些简单指标均无法完全准确的代表投资能力。过于片面的追求这些指标的优化，还容易陷入过拟合的风险。

3 深度学习算法的局限

目前取得重大进展的以深度学习为代表的 AI 技术，本质上还是基于数据的统计，是一种高维空间的模式识别。这使得 AI 无法“理解”任务内容，在 AI 看来所有的任务都是寻找 f 使得 f(X) -> Y 的过程。这样AI的效果将极其依赖于给定的输入 X 与输出 Y。前面两节已经提到，在投资任务中，输入 X 中包含了大量的垃圾信息，又将很多真正有意义的信息排除在外；输出 Y 又不易准确量化评价。对于人类来说，存在大量的领域背景知识，可以轻松的滤掉“显而易见”的无用或错误信息。但是现阶段技术下，这种领域背景知识很难迁移到 AI 中。AI 将对所有信息一视同仁，努力在其中发现模式，而这种模式将完全不同于人类的思维和理解方式，对于人类来说几乎是一个黑箱。这等于 AI 放弃了人类文明千百年来的持续积淀，仅通过目前人类给他划定的一部分信息，采用不同于人类的方式自学成才。对于围棋来说，棋盘上的信息是完全的，人类的所有领域知识积累都可以从棋盘上推演得到，人类的知识显得“多余”了。但对于投资来说，涉及的信息无法穷尽，此时放弃人类知识就是非常危险的。那些人类闭着眼都不会踩到、甚至根本无法意识到其存在的坑，都很可能就会让 AI 阴沟里翻船。更何况现在的 AI 对于针对性构建的恶意样本还非常脆弱，一旦被人恶意利用，后果不堪设想。

AI 投资言过其实

同时，现阶段的 AI 投资还面临一个重大挑战就是数据匮乏。从基于统计的机器学习开始，到现在的深度卷积神经网络，对于复杂的问题采取了使用海量数据学习以暴制暴的方式。AlphaGo 对弈了数百万盘围棋，达到了人类的水平。而一个人类棋手从学棋开始至达到职业水平的对弈数连 AlphaGo 的零头都不到。在这一点上，目前的 AI 与人类的思维方式还有着显著的差别。AlphaGo 击败了人类也不意味着机器就比人更聪明。

人类的优势是对复杂数据进行高层次的抽象，大道至简；而深度学习算法则是充分发挥机器的优势，以量取胜。这使得人类能够从少量的样本中总结出深层次的简单规律，并利用这些规律做出各种预测；而 AI 在目前阶段无法做到这一点。观察到苹果落地，牛顿总结出是因为地球的引力，据此发展出万有引力定律；爱因斯坦总结出是因为地球质量造成时空弯曲，据此发展出广义相对论。他们都通过少量（相对 AI 的训练数据规模）的观察准确的抽象出了高层次的一些规律。

在小样本上的学习能力、深层次规律的抽象泛化能力，人类远远强过 AI。如果巴菲特是 AI，他可能需要看过 100 万家“可口可乐”公司的成功，才能在实际中选出可口可乐。但很可惜，可口可乐公司只有一个，历史也只有一次。对于 AI 来说，这样的学习数据实在是太少了。现阶段的 AI 算法，如果学习数据太少，会非常轻易的陷入过拟合的陷阱 —— AI 记住了所有的学习数据，而非其中真正能够持久生效的一些深层规律。从投资到计量经济学，都注定了只有唯一的历史数据可以学习，时间持续流逝，环境不断变化，你也无法控制同样的环境反复的实验验证。此时就要求必须能够从这少量的甚至是唯一的样本中总结规律。现在 AI 言必称大数据，而爱因斯坦 100 年前没有任何实际的观测，通过“零数据”就预言了引力波的存在，直到 100 年后的今天才被实际观测到，这种能力现阶段的 AI 是无法企及的。专家们早已注意到了机器学习过于依赖样本的局限性，小样本学习的问题已经被推到 AI 领域前沿，但迄今未出现像深度学习算法这样的重大突破。目前 AI 仍然无法脱离模式识别的范畴，我们离实现真正的智能还有很长的路要走。

4 AI 投资路在何方

目前 AI 在投资上也并非无用武之地。尽管整个投资任务对于 AI 来说过于宽泛复杂了，但 AI 在一些特定的具体领域任务上足以与人类媲美，已经证明了其巨大价值。AI 的长处在于大量繁杂数据的高速处理，而人类的长处在于化繁为简，达到更高的抽象层次。人类和机器具备各自独特的优势而又能够有效互补。对于投资来说，AI 可以作为工具，帮助人类去高效的完成一些特定环节。我们仍然应当以人类投资的成功经验为基础，在其中一些特定环节上由 AI 替代人类高效完成。目前我们关注研究的重点不应当是 AI 如何替代人类做投资，而是如何作为工具帮助人类更高效更好的进行投资。将 AI 引入投资领域的商业本质仍然是效率的优化，是时间、成本、质量之间的平衡。AI 的引入能够大幅降低低端人力成本，提高企业投资业务处理能力，从而获得更高的边际效益。作为专业投资者应当拥抱这种变革，但不应对 AI 有不切实际的期望，更不应当把 AI 作为噱头，勉强蹭热度。只有深入的理解 AI 技术，才能了解 AI 的优势与局限，让 AI 为投资发挥其最大的效能。