ChatGPT 是一种针对对话交流场景优化的强大语言模型(LM),我认为它现在是世界上表现最出色的聊天机器人——尽管它的这一地位可能不会持续太长时间。 在 ChatGPT 模型于 2022 年 11 月 30 日发布后,人们很快意识到,它的存在意味着 LM 有可能在短期内超越传统搜索引擎(SE),成为在线信息检索的主要手段。推而广之,这意味着谷歌在搜索领域长达两个十年的霸主地位可能岌岌可危。 微软推出 ChatGPT 模型的新版 Bing 服务的消息,重新点燃了关于 LM 与 SE 地位的争论。尽管没人真的知道故事将如何进行下去,但在一件事上人们几乎达成了共识;以某种方式,LM 和搜索很可能在未来成为一个更大整体中不可分割的部分。 就像地心引力将我们拉向地面一样,技术自发地朝着一个方向流动,也就是“让我们的生活变得更加美好”——让人想起热力学定律描述的图景。LM 更直观,与它们交互对我们来说是很自然的事情。“SE 要么改变要么消亡”似乎是不可避免的结果。 我知道,这听起来像是典型的,不可证伪的那种胡乱预测。但起码我们能设法回答一些答案未知的问题:ChatGPT 是否对谷歌构成真正的威胁?微软能击败谷歌吗?这家搜索巨头能否做出足够的反应?最终哪家公司会拔得头筹?LM 会取代搜索吗?会成为搜索引擎的重要补充吗?LM 将在哪些方面改进或弱化搜索技术?这一切将如何以及何时发生? 我们来试着回答其中的一些问题,了解 LM 和 SE 在未来将如何互动,微软、谷歌和 OpenAI 对这一切有何看法,再谈谈我认为未来几个月 / 几年的故事将如何展开。 在 ChatGPT 公开的那天,一位名叫 josh 的 Twitter 用户首先提出了这个观点:“谷歌完蛋了。”其他人,比如现在已经是前推特员工的 George Hotz 同意这个看法——但并不是每个人都得出了相同的结论。 Gary Marcus 教授用经验证据反驳了 George Hotz 的观点,谷歌的 François Chollet 也指出了类似的问题:“搜索是搜索问题,而不是生成问题:” 我同意 Marcus 和 Chollet 的观点。LM 本身并不是为超越 SE 而打造的。然而,SE 可以为搜索技术带来重大改进,以至于那些不集成很多基于 LM 的功能的 SE 将迟早过时。 如果我们接受这个假设,那么很容易看出最有机会将 LM 和搜索结合起来的公司就是谷歌,不是 OpenAI,不是微软。谷歌在这两个领域上单拿出来都有着无与伦比的世界领先地位。尽管 OpenAI 很受欢迎,但 GPT-3、ChatGPT 和所有类似模型都是基于谷歌的技术,谷歌的 SE 占据了 4/5 的市场份额。 正如 Stability 的 Emad Mostaque 所说,如果该公司没有出产那么多人工智能产品,那是因为它的“制度惰性”。谷歌在研究深度和广度指标上无疑是全球领先的人工智能公司。 然而,正如受欢迎的投资者 Balaji Srinivasan 所说的那样,研究和生产是两个完全不同的领域:谷歌不能承担从头开始重组其 SE,以使用 LM 为其提供动力所面临的风险。多年来,该公司推出了一系列新的搜索功能和渐进式改进,但不会像微软以及其他公司,如 Perplexity、You 和 Neeva 那样做出可能是革命性的举动。 我对 LM 与 SE 相关争论的看法可以总结如下:”搜索引擎的局限大得多,但它也是专门为线上搜索优化的……但我不认为传统搜索引擎是 LM 的对手。”这里的关键词(原文没有提到这一点)是“传统的”。 SE 仍将生存下去,但它们会和今天的 SE 非常不同,甚至完全看不出来是同样的东西。LM 很可能就是这一差异的背后原因。 (我不会详细讨论将 LM 集成到 SE 中是否是个好主意。Gary Marcus 在这方面有一篇很棒的文章,我几乎完全同意他的观点:“Is ChatGPT Really a “CodeRed” for Google Search?”) 微软对 OpenAI 的 10 亿美元投资——以及他们获得后者部分 AI 技术栈的独家许可——是其对该领域拥有浓厚兴趣的明确信号。他们计划将 DALL-E 和 ChatGPT 集成到他们的服务中也就不足为奇了。正如 Tom Warren 所写,增强版的 Bing SE 可以“挑战谷歌的主导地位”。 当然,我们的想法不是用 LM 代替 SE,而是对其进行补充。微软发言人告诉彭博社,“对用户查询的对话式和上下文式回复将为搜索用户提供比一串链接质量更好的答案,从而赢得更多用户。” 与谷歌不同,微软非常清楚 LM 不如 SE 可靠。该公司必须要评估将一些人们不能 100% 依赖的功能部署到生产环境的风险,虽然这些功能可能会为它赢得与谷歌战争的优势。微软正在“权衡……聊天机器人的准确性,初始版本可能是对一小部分用户的有限测试。”听起来是个合理的开始。 但是,如果有人比微软更了解 LM 可以做什么和不能做什么,那就是谷歌。在一篇 2021 年的论文中——其发表时间甚至在 ChatGPT 还只是一个想法之前——谷歌研究人员探讨了使用 LM 来“重新思考 [] 搜索”的问题。 他们考虑了我们是否可以这样做,更重要的是,是否应该这样做:
谷歌的最终结论是,使用类似 ChatGPT 的系统来增强其 SE 将带来很高的“声誉风险”。CEO Sundar Pichai 和 AI 负责人 Jeff Dean 告诉 CNBC,“如果出现问题,这种做法的成本会 [比 OpenAI] 更高,因为人们必须相信他们从谷歌获得的答案。” 谷歌于 2021 年 5 月宣布推出 LaMDA(但并未发布)。鉴于 LaMDA 与 ChatGPT 至少旗鼓相当,(Blake Lemoine 是这样说的)——我们有理由质疑为什么谷歌没有利用它来应对像 OpenAI 这样的威胁。Balaji Srinivasan 猜测这是因为该公司没有足够的“风险预算”,事实证明他是对的。 像谷歌这样的大公司为数十亿用户(而不是像 OpenAI 那样只有几百万)提供像谷歌搜索这样的高可靠性服务,不能仅仅因为一项技术似乎代表未来,每个人就都要为之疯狂。 但谷歌的高管们不是傻子。他们知道 ChatGPT 由一家规模小得多、风险规避程度低得多的公司掌控,这确实是一种威胁——当像微软这样的直接竞争对手拥有大量股份时更是如此。据《纽约时报》报道,这就是他们宣布 ChatGPT 为“红色代码”的原因:
就目前的情况来看,谷歌面临着微软(在搜索领域是一个强大的直接竞争对手)和 OpenAI(后者拥有同水平的人工智能技术,虽说其预算要紧得多)的挑战,同时,谷歌还要努力平衡 LM 由于其内在的不可靠性带来的声誉风险,以及它们在风险厌恶程度较低的初创公司手中这一事实所构成的明确威胁。 正如 Pichai 所说,谷歌必须“大胆而负责任”,找到折衷方案。“我们把这件事做好是非常重要的,”Dean 总结道。 鉴于目前的情况,我认为如果要预测接下来会发生什么以及如何发生,我们需要关注三个关键点。首先,谷歌到底在和谁竞争,才会将“声誉风险”报告为未来其面对的主要障碍?其次,是否有可能使用 LM 和当前的 AI 安全技术来“获得完善的版本”?第三,如果这件事可以做到并且公司认为应该这样做,是否可以从中衍生出可行的商业模式? 当我读到 Pichai 和 Dean 关于 ChatGPT 威胁的论点时,我注意到了一些奇怪的事情:他们似乎在暗示谷歌正在与 OpenAI 竞争。事实上,OpenAI 的技术是谷歌高管眼中的“红色代码”,但我认为 OpenAI 不会对谷歌构成威胁——这是错误的构想。 一方面,OpenAI 在技术研究和人工智能专业知识方面无法与谷歌匹敌。谷歌的预算和人才远远超过 OpenAI——光是从数字上就能看出来。正如 Emad Mostaque 所说: 另一方面,OpenAI 不想与谷歌竞争。 OpenAI 的声誉风险远低于谷歌,因为它是一家相当新的小型公司,充其量只为几百万用户提供服务,而据估计,全球有超过 40 亿人使用谷歌搜索,他们占据了惊人的 84% 的市场份额。 然而,OpenAI 的目标是构建有益的通用人工智能(AGI)。他们为什么要冒着放弃一个可以说是更优越的目标的风险,在一个与他们的主要目标完全不重叠的领域与一家更大的公司对抗呢? 即使 OpenAI 主要追求的是经济利益(不可否认,战胜谷歌将带来无可估量的巨大财富),该公司也有更好的,不会与其长期目标相冲突的选择,比如建立付费订阅或支付 - 使用模型,就像他们现在所做的那样(例如 GPT-3 和 DALL-E)。 就影响力、规模、预算以及最重要的目标而言,谷歌真正的竞争对手是微软。但是,如果我们以这种方式看待它,谷歌不得不面对更高声誉风险的论点就站不住脚了。微软的用户数量与谷歌相当,微软也必须维护其精心打造的声誉——其在 2016 年关闭种族主义聊天机器人 Tay 的决定就体现了这一点。 支持“声誉风险”观点的一个论据是,微软的搜索市场份额比谷歌小太多了。然而,如果微软将 LM 和搜索结合起来的尝试取得成功,他们的用户数量会大幅增长,因此声誉风险也会相应增加。 留给微软回答的问题是,他们是否愿意冒着声誉风险做出将 ChatGPT 集成到 Bing 的决定,让越来越多的用户被新服务的更强大功能吸引进来,只是为了有机会推翻谷歌。 谷歌打算如何应对? Jeff Dean 的解释是,谷歌正在等待“技术完善”,这让我想起了我对将道德原则嵌入 AI 模型和打击错误信息的举措曾有着天真的期望。我认为,以后也会继续坚持说这些工作是最重要的,但我可以看到,虽然它们在理论上是非常理想的,但在实践中却变得几乎不可推行下去。 在我看来,按照 Dean 在这里所说的意思,完善 LM 的唯一方法是重新定义、重新设计和完全重建它们。如果像 Gary Marcus 所猜测的那样,他们只是没有足够的能力做到真实、真实、可靠和中立,那么就没有任何临时抱佛脚的方法能够遏制源自 LM 所学习的数据中的那些恶行。 一种可能是,一旦有公司试图将 SE 与 LM 结合起来,保障前者可靠性的所有关键特性都会因 LM 缺乏相应的功能设计而失效。Marcus 在他对 Perplexity、Neeva 和 You 的分析中充分证明了这一点。他的结论让人们对未来充满希望,但终结了现在的争论:
另一个问题是当前最先进的 AI 技术是否足够优秀,是否指向正确的目标。Scott Alexander 写了一篇关于通过人工反馈强化学习(RLHF)的局限性的好文章,而 ChatGPT 使用的就是这种技术,并且它似乎是公司阻止 LM 的行为缺陷的唯一方法。 Alexander 直言不讳:“RLHF 效果不佳。”正如我在自己关于 ChatGPT 的文章中所写,“人们可以'轻松地’通过它的过滤器,而且它很容易被迅速注入新数据。”RLHF 优化模型也可能进入优先级冲突的循环。Alexander 说,“惩罚无用的答案会让 AI 更容易给出错误的答案;惩罚错误的答案将使人工智能更有可能给出攻击性的答案;等等。”我们可能无法让 LM 同时生成有用的、真实的和非冒犯性的响应结果。 此外,如果 LM 对 RLHF 的改进是渐进式的,正如 Alexander 想到的那样,我们将永远不会“完善”它。然而,因为它是性能最好的方法,公司没有动力花费时间和资源研究另一个可能像 RLHF 一样有效的好主意。 如果以上所有事实都是正确的——也就是说 LM 本质上不适合搜索,而我们可以使用的最好的技术也不怎么样——那么短期内就不会出现 Jeff Dean 所期望的,可以满足谷歌需求的“完善”时刻。 谷歌将面临两难选择:一方面,他们可以让微软率先承担“声誉风险”,但这样微软就有可能重新定义搜索未来并成为该领域下一个霸主。另一方面,他们可能会认为“完善技术”是一个过于雄心勃勃的目标,于是冒着自己的声誉风险,通过一系列公关举措(例如对公众说“我们尽可能努力地尝试”)和半生不熟的功能(例如对公众说“它现在表现更好了”)跌跌撞撞地前进,但最终在人工智能和搜索领域都保持领先地位,并在接下来的几十年中幸存下来。 如果问题的本质是谷歌必须在其声誉或生死存亡之间做出选择,我想我们都知道会发生什么。 接下来是挑战的最后一部分,如果谷歌一切顺利,他们迟早会遇到这一障碍。微软也逃不掉。如果搜索引擎是通过广告业务模式盈利,那么公司如何在用户无需点击任何内容的情况下通过 LM 驱动的搜索获利? 谷歌(如果它选择带头)能否找到一种方法来围绕 LM 驱动的搜索创建护城河,同时围绕 LM+ 搜索构建一个新颖的可行商业模型?二十年前,谷歌的 PageRank 算法与广告模型相结合创造了无与伦比的奇迹。谷歌能否重塑辉煌? 当然,如果我们能享受无广告的互联网肯定是最好的。然而,如果替代方案是将搜索转变为付费服务,人们愿意接受这样的转变吗? 我看到的另一种可能性(这可能只是一个疯狂的假设)是微软可以决定将搜索引擎变成一种非营利性服务(没有广告或任何其他形式的货币化服务),其唯一目标是在未来击倒谷歌这家对手。 但是,还有其他问题可能会阻止微软尝试这一举措。正如 Marcus 在他的文章中解释的那样,当前搜索技术比 LM 便宜得多,而且速度也快得多。这意味着公司转型后获得的利润会下降。微软在与谷歌竞争的同时会耗尽资金,这会让双方都陷入困境,这似乎是一项非常冒险的业务决策。 无论最终发生什么,很明显,二十年来几乎停滞不前的搜索领域即将经历前所未有的拐点。 原文链接: https:///microsoft-vs-google-will-language-models-overtake-search-engines-4e9590bed232 你也「在看」吗? 👇 |
|