人机融合智能：一条通向未知的艰险征途

明日大雪飘 2023-03-06 发布于上海

展开全文

有人说，新技术的迭代周期已经是一年一届。从2021年10月扎克伯格将公司改名为Meta宣布进入元宇宙元年，仅仅一年，全世界跟风掀起的All in元宇宙热浪似乎已被ChatGPT浇灭。

ChatGPT是什么

简单说，ChatGPT是一种专注于对话生成的大型语言模型。它被比喻为“搜索社交”的智能结合体，引入了核心技术RLHF（基于人类反馈的强化学习），以获得持续进步、天天向上的更好效果。我们每一次使用都在帮助它的进化，某种意义上说，我们是机器学习的助手。

从本质上看，ChatGPT还是程序，尽管它看起来好像具备人的心智，但与真正的人类“心智”有着根本区别，两者运作机制完全不同——只是我们把它“想象”成了人类。

ChatGPT了不起的突破是，可以自主生成创造性的答案，甚至像理想中的“人类”那样能“主动”承认错误、优化答案；质疑你提问的差错，甚至敢于承认自己的“无知”——这是一个非常大的跨越。它踩在了弱智能与强智能的边界，让我们对AGI（通用人工智能）重燃希望——但它依然不是AGI，即使它正在成为一个新的起点，这一步仍然天差地别。

AGI被描述为可以完成甚至超越人类完成所有的任务。从特定属性到环境的一般属性，它都能提供完整的解决方案。AGI的终极目标是实现自主的感知、认知、学习、决策、执行和社会协作，符合人类的情感、伦理与道德观念。换句话说，它至少要满足四个关键条件：（1）能够像人类那样自主产生任务；（2）能处理在复杂动态的物理和社会环境中没有预先定义的任何任务；（3）具备辨别是非的价值系统；（4）具备人类那样的情绪感知与审美能力。

也就是说，能做到不仅拥有完成目标的能力，还能享受过程中的主观体验，是由感知与价值认知架构所驱动的通用智能体——而ChatGPT既没有自我“体验”，也不能“自我”审视和理解自身的作为——这就是那关键的一步。

ChatGPT为什么火

ChatGPT引起全球关注，不应忽视其在商业上的成功。国内外虽有很多科技巨头在研究聊天机器人，也布局了多年，但2022年的最后关头，只有ChatGPT脱颖而出。这不是因为运气，而是它准确地把握住了自身技术特征与人性需求的契合点，并且恰逢其时——这一点很像乔布斯“美学”，尽管看上去它和诺基亚做的都是“手机”一样。

ChatGPT有一件事做得很关键，就是建立起真实的用户调用和模型迭代之间的互动。在充满不确定性的时代，寻求来自神秘力量的“答案”迎合了人类对未知的迷茫与恐惧，也满足了人们对未来的好奇与渴望。

其实，ChatGPT的成功靠的不是单一环节，而是系统化的整体突破。在这里，被答案化的不仅是知识，还包含人的身体、行为甚至灵魂。

与迫不及待炮制“元宇宙”概念的Facebook不同，ChatGPT给产业带来的影响是实质性的。政策制定者和社会治理的研究者们必须马上给出回应，因为ChatGPT可以与其他AIGC模型联合使用，获得产业落地的场景，呈现各种酷炫而实用的功能——激荡变局中的企业从中看到了希望，竞相奔跑在还未设立规则的赛道上。

比尔·盖茨说过，人们总是高估新技术出现的第一个五年，低估第二个五年。如今，ChatGPT似乎让人无法忍耐“让子弹飞”的寂寞。风口之下，科技巨头们纷纷提前推出相似产品——Google、Meta的聊天机器人Bard和BlenderBot，百度、阿里、京东、科大讯飞等也相继发布了ChatGPT产品计划。

科技创新背后，尽显企业对未来产业的激烈市场争夺战。

差距在哪里

有文章说，ChatGPT研发团队里10%是华人，说明海外华人是全球科技创新的重要力量。那么，类似的AI突破会发生在我们身边吗？如果有差距，我们从中可以获得哪些启示？

首先，ChatGPT让我们更深刻地意识到，任何科技创新成功绝不可能是单点突破，一定是系统性和生态级别——算法编程、硬件材料、数据思维与能力、机制模式甚至文化综合作用的结果。以至于复旦大学张军平教授说，想超越ChatGPT，至少编程、硬件、数据这三方面都要同时使力。

在物联网语境里，“硬件”的重要性尤其不能忽视。美国对顶级计算芯片有限制，比如ChatGPT用的Nvidia A100，国内就无法获取，这导致算力上会有差距。要突破卡脖子环节，我们从芯片到显卡都需要实现彻底突破。

其次，巨大成本令人咋舌。我们显性看得到的是直接的经费投入，比如大模型的训练成本。目前ChatGPT知识更新频率还无法与现实发展同步，知识训练库只停留在2021年。即便为了达到当前的效果，ChatGPT大概用了285000个CPU和10000多颗GPU，24小时不间断输入数据，用45TB的文本数据量、近万亿个单词（相当于1351万本牛津词典）来训练模型。据小冰机器人研发专家估算，训练这样一个包含1750亿参数的语言大模型，至少需要每天3亿、一年近千亿元人民币的对话成本。

那么，隐性的成本呢？OpenAI从成立到推出ChatGPT用了7年时间，直到去年还处于亏损状态，也曾饱受质疑。没有谁能够轻轻松松地成功，科技创新尤其需要较长时间的积累。现在市场骤热群起跟风，那些模仿功能的产品在创新上的意义在哪里？

能否耐得住寂寞，不只是财力投入的持久，还有赖于对科技发展趋势与人类演化的洞察。“人工智能”可视作人机智能的融合，这是一条布满荆棘又极为艰险的道路。趋势判断力决定了我们对技术孵化的态度，能否从国家战略的高度对目标设定、节奏把握、资源投入以及评价机制进行总体布局和科学决策，决定了未来若干年的结果，而国内智库在这方面的贡献实在乏善可陈。

此外，教育理念僵化、学科边界固守、学术风气腐败等现象，都造成了科研的功利性和实事求是的科学精神匮缺。毫无疑问，在重大科技创新实践中，扎实培育原创力是保持民族发展活力与国家强大竞争力的核心要素。

机会在哪里

只要能够感知趋势，那么ChatGPT带来的就不仅是启示，也有机会。

首先，“真相”和无限接近真相的可能。在收购推特时，埃隆·马斯克就说，成为一个最大限度被信任的数字公共广场是非常重要的。清华大学黄民烈教授提到，在GPT-3之后，OpenAI所有的模型都没有开源，但提供了API调用，且非常重视真实世界数据的调用以及这些数据对模型的迭代。没有前提的真实，再优秀的算法模型也只能产生错误。

2月8日，Google聊天机器人Bard首秀犯下事实性错误，加深了人们对于GPT的不信任感。事实上，公开场合面临的是最苛刻和专业的审查，而更多的翻车则是在无法核验或者普通人不具备知识优势的寻常场合。

这正是ChatGPT饱受诟病之处。大家公认，它善于一本正经地胡说八道。而对于公众而言，这比一眼可见的虚假和骗术更危险。

目前，ChatGPT还是一个黑盒计算，在内容的可信性和可控性上都有较大局限。这既是研发可以深化的角度，也是产业机会和市场空间。尽可能准确的信息、通过核验优化的知识，与知识图谱这类知识管理和信息注入技术结合，在特定的数据范围和应用场景内，就可能获得更为可靠的结果。这也是2018年以来我们的研发团队研发“源数据”的初衷。

我一直认为，传媒业是上苍给人类的一个用于揭示真相的最好“礼物”。

其次，行业数据及信息安全保护。对于国内的科研与产业而言，这都是一个有限的窗口期。一方面，ChatGPT没有开源，需要重建这个系统的话难度比较高。另一方面，数据规模达到如此大的量级可能会比较困难，ChatGPT收集的数据都来自互联网，大部分是英文，比较容易拿到。而在国内，有数据安全法等一系列政策，行业与产业数据的收集是很困难的事情，即便拿到的数据也因为安全风险难以共享。当然，这对于在特定环境内加快研发、补齐短板无疑是有利的。

另一个被忽略的问题是，要高度重视AI进化与社会治理、技术伦理的研究，而且到了刻不容缓的地步。制度建设往往落后于现实变革，但AI的到来需要我们有预见性和治理模型的预设能力，否则类人智能甚至新“物种”的出现将令人类悔之晚矣。

目前，国内的人文社会学科与理工学科还存在相互割裂的状况，严重影响了我国人工智能整体发展水平的提升。简单地把人工智能当作计算机学科或某一学科的专属领地，甚至排斥脑认知、神经学、心理学、医学与法学、伦理学、哲学的融合，其后果很快将显现出来。

应该说，商业狂欢与产业应用的突飞猛进，无法补偿我们在未来因匆忙无知所付出的代价。今天，人机智能融合的探索已很难预言结局，只能在跋涉中不断反思、自省，因为东西方文明所面对的是人类共同的命运，这也是人类科技文明走向光明未来的唯一选择。