没想到啊没想到,百度这次居然玩的这么大! 10月17日,百度举办了“2023百度世界大会”。一开场,李彦宏就兴奋地宣布“文心大模型4.0正式发布”,甚至还说出“文心大模型4的综合水平完全媲美GPT-4”的豪言壮语。要知道,GPT-4被认为是迄今为止最强大的AI模型,不只是陪你聊天帮你画画的那种强,而是“律师模拟考排名前10、GRE口语接近满分”的那种强。 ▲图:李彦宏宣布文心大模型4.0正式发布 李彦宏觉得,当下流行的、在原有产品中加入AI辅助(AI-based)的混动模式,未来将无法为火力全开的AI提供足够的燃料,所以,百度要全面转型“AI原生”。不是所有产品都接入AI的那种全面,而是“所有百度产品全部重做”的那种全面。 并且,不是光说的喔!这次百度真的拿出了十余款“AI原生应用”,包括重构的百度搜索、新文库、网盘(云一朵)、地图等,以及号称国内首款生成式商业智能(GBI),可以实现秒划重点、一键差旅等功能,并在现场进行了演示。 我们也试着体验了一下百度网盘的AI功能。 ▲图:在百度云盘种,利用AI对视频进行解读 尽管如此,我们还是有一个巨大的疑问,到底百度AI发展到了什么程度,才会让李彦宏说出“不输GPT”“全面转原生”的话? 01、媲美GPT的,不只是版本号 自从AI诞生之日起,科学家就一直梦想着有朝一日,AI可以像人类一样思考。既能理解人类的需求,也能理解背后的潜台词和隐含的信息,同时,AI还应该能够进行逻辑推理,并且在多轮对话中不会断片,随时接得上之前的话茬。 简单来说,AI的核心能力体现在理解能力、生成能力、逻辑能力以及对上下文的记忆和推理能力上。 通过4个案例,李彦宏展示了文心大模型4在理解、生成、逻辑、记忆这4个方面的表现。 值得一提的是,这次没有放录像,而是现场演示。 ▲图:李彦宏展示文心大模型记忆能力 在展示文心理解能力时,李彦宏要求文心回答在承德买房能否使用北京公积金的问题。但李彦宏挖了个坑,并没有直接说出要用北京公积金,只说“想在承德用公积金买房,在北京工作”。然而文心不仅准确的理解了这个前后乱序的表述,甚至还理解了背后的潜台词:在北京工作,很可能在北京缴纳公积金;想在承德买房,很可能是承德户口。 最终,文心给出了准确且详细的解答。 接下就更神了。 李彦宏只给了文心一张汽车图片,然后让它做出带文字的海报,甚至要求“结合已有视频,生成一个数字人口播视频,用于投放信息流广告”,AI都很好的完成了,全过程不到3分钟。 随后,李彦宏还不忘询问在座的各位文案工作者,如此一人能顶一个队伍的效果,大家是否感受到了大模型的威力? 在考验文心逻辑能力时,李彦宏举了一个辅导孩子作业的例子。文心不仅仅可以详细的给出解题步骤,同时还能对题目中用到的知识点给予解答。 为了展示文心的记性有多好,李彦宏只提了一个要求:“武侠小说,主人公是女生,情节要跌宕起伏”,文心就生成了一个天选之子对抗武林黑恶势力的故事大纲,并将主角设定为名叫灵儿、拥有操纵内力和飞行力量的女生。 接下来就好玩了。李彦宏开始不断的增加需求,而文心就像个乙方一样不断的给出解决方案。最后李彦宏突然像老师抽查学生一样,问它主角的能力是什么?不出预料,文心没有忘记自己开头的那个设定。 除了C端应用案例外,百度还展示了AI在B端的落地实践。 无论是C端还是B端,百度都在不断强调“AI原生应用”这个概念。那我们不禁要问,什么样的应用才算“AI原生应用”?而AI原生应用和我们平时感受到的AI应用有什么区别,难道说我给自己的AI应用加个“原生”,它就启动了? 02、AI原生,让AI彻底放飞自我 首先我们要明确一个设定,那就是:AI原生(AI Native)≠AI混动(AI-based)。 目前我们能享受到的AI能力,绝大部分都是AI功能的整合或接入,这类应用很早就被科技公司部署到了产品中。例如亚马逊对AI的应用可以追溯到1998年,而根据网信办数据,当时美国的互联网普及率也只有18.6%。 随着AI技术的发展,AI整合和接入的场景变得更加多样化,大有一种从开发者专武到多行业泛用、从少部分人受益到更多人受益的趋势。 ▲图:百度AI原生应用“全家桶” 2021年GitHub推出AI编程助手Copilot,只需要给出一句话描述,就能自动生成一段代码,极大的提升了编程效率(体验)。此时Copilot的受众,仅限于具有一定经验的开发者。 而到了2023年,微软将Copilot集成到Office套件中,只要能用到Word、Excel、PowerPoint、Outlook、Teams的地方,都能享受到AI带来的效率提升,使得Copilot能够为更广泛行业的用户群体服务。 尽管如此,此时的AI依旧只是作为产品的一个附赠功能,用户仍然需要先熟练使用原有产品,才有机会享受到AI带来的辅助加成。而填补用户和AI之间鸿沟的重任,被寄予到了AI原生身上。 AI原生和AI-based的关键区别,在于是否将AI作为核心。 AI-based应用中,核心是原有产品,AI只是加分项,有了更好、没有也不耽误;而在AI原生应用中,AI是根基,没有AI就没有AI原生应用。 一句话:AI原生产品的每一个细胞都带着AI的基因。 ▲图:AI原生和AI-based应用的区别 AI原生具有以下几个特点:数据驱动、持续学习、自适应和自主性,以及NLP。 相比AI-based,由于AI原生本就建立在AI的基础之上,所以不需要向后兼容原有产品。而AI-based因为是将AI功能整合到原有应用中,不可避免要做出取舍,影响AI发挥全部能力。 更重要的是,AI原生将有可能改变人机交互方式。在AI原生应用中,用户只需要给出提示词,即可一站直达目的地,如此一来,复杂的多级菜单就显得没有必要了。 例如一个创作者使用视频剪辑工具制作视频,需要操作很多选项,尤其是在时间线上的反复跳转,十分耗费精力和时间。而在AI原生应用中,用户只需要描述出想要的结果,编辑软件会自己去调整各种参数。在时间线上,用户只需要说出视频内容,AI会自动跳转到对应的片段。这样一来,很多下拉菜单、右键点击、快捷键等操作都不需要了。 而李彦宏的设想更激进,他觉得所有AI原生应用交互不会超过两级菜单,因此现有的百度产品,全部要基于AI原生进行重构。可想而知,一旦这个巨大的工程真的实现了,整个产品的逻辑、交互的方式等等都会产生巨大的变革。 可是,别的大厂都不做,百度为什么这么头铁? 03、百度的勇气,来自一把刷子 百度的勇气,来自一把“刷子” 去年百度世界大会上,李彦宏说“每个人、每家企业都要有一把自己的刷子,技术就是百度的那把刷子。”目前看来,这把刷子还挺好用。 在IDC 发布的《AI大模型技术能力评估报告,2023》中,共选取了9家大模型技术厂商进行重点研究,通过用户访谈调研,从用户关注的技术能力、产品功能、生态服务等方面进行评估,得出结论“百 AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段”。 而据多个公开测评结果,文心大模型3.5的综合能力已超过ChatGPT 3.5。 ▲图:李彦宏 新的文心大模型,则在已有基础上,进行了大幅提升。号称可以媲美GPT-4的文心大模型4.0,在参数量、训练数据量以及推理成本上,比3.5高出一个数量级,其理解、生成、逻辑、记忆核心能力都有极大的提升。 文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。 据王海峰介绍,通过文心大模型生成的代码,采纳率在百度内部达到了40%,高频用户甚至高达60%。并且,文心大模型4.0还在以下方面获得了突破: · 万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练 · 建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果 · 基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐 · 可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度 ▲图:王海峰介绍文心大模型4.0的创新和突破 而这一切,靠的就是更大更好的模型、更大算力、更多数据,以及更强算法。 04、AI的最大价值,人人受益 AI技术的发展,让人们看到了未来无限的可能性。 视频制作公司Waymark使用Dall-E创作了一部12分钟的短片《The Forst》(霜),从脚本、到画面完全由AI生成,最终效果和好莱坞大片相比也毫不逊色。 ▲图:AI制作的短片《The Forst》镜头 电商软件加入AI机器人,可以做到24小时随时随地秒回复用户的提问;办公软件接入AI,让很多复杂的流程变得简化,检索文档、数据变得更加方便;利用AI的识图能力,用户可以拍下眼前的食材直接让AI生成食谱;而通过AI的语音识别能力,可以为视频、录音等生成字幕,并对内容进行总结。 但李彦宏觉得这还不够。 他认为AI的潜力,是每个人都能够从中获益、每个行业都能够得到提升的能力,这就需要更多人参与进来,开发出更多行业应用。而槛最低,也最容易上手,能让开发者、创业者快速加入到生态中的方式之一,就是插件。 依托文心大模型,百度为开发者、创业者提供了一个创造AI原生应用的土壤,之后,就可以像滚雪球一样,开发出更多、更能满足用户多样化需求、提升不同行业效率的AI原生应用。 随着这个雪球越滚越大,未来的“AI原生世界”,越来越让人期待了! 作者|吴狄 编辑|胡展嘉 运营|陈佳慧 出品|零态LT(ID:LingTai_LT) |
|