分享

新火种 | 百模大战

 qff989 2023-10-21 发布于广西

第一集:百模大战打响

一身白衬衫,一双小白鞋,2023年3月16日,百度CEO李彦宏一个人站在台上,发布了百度的大语言模型“文心一言”,虽然李彦宏从文学创作、商业文案创作、数理推算、中文理解和多模态生成五个方面展示了“文心一言”的能力,但对比起ChatGPT,市场还是表现出了失望的情绪,发布会进行到一半,百度的股价跌幅就扩大到了近10%。

实际上,随着ChatGPT这位王者的空降,包括“文心一言”在内,不少勇者都对中国版ChatGPT的宝座发起了冲击,一场大战已经悄然打响。

2月20日,当流浪地球2还在席卷电影院票房的时候,一个和电影中的人工智能MOSS同名的大语言模型发布了。作为国内第一个对话式大型语言模型,MOSS一推出就受到很多人的追捧,发布当晚,它的官网就因为服务器流量过载而瘫痪。

3月16日,开头我们提到的“文心一言”发布了,在对标ChatGPT上,“文心一言”备受关注。虽然市场情绪不算好,但在做大语言模型上,百度有智能云、充沛的算力以及日活数十亿的搜索引擎来提供中文的本地化数据等软硬件支撑,还是有一定技术底蕴的。

同样在3月,还有另外两款大模型被推出,他们分别是澜舟科技推出的孟子模型MChat以及清华大学推出的ChatGLM。

而到了4月,更多的互联网企业加入到了这场追逐之中,商汤科技发布了“日日新”大模型体系,包含中文语言大模型应用平台“商量”、图片生成模型“秒画”、AI数字人视频生成平台“如影”、3D内容生成平台“琼宇”和“格物”等,据说啊,“日日新”这个名字还是取自《礼记·大学》中的“苟日新。日日新,又日新”。

阿里CEO张勇则在商汤发布会的第二天举行了“阿里云峰会”,表示未来阿里巴巴所有的产品都会接入“通义千问”大模型,包括天猫、钉钉、淘宝和优酷等,还喊出了那句在之后被频繁引用的话:面向AI时代,所有产品都值得用大模型重做一次......

而在创业领域,互联网创业者也坐不住了,前美团二号人物王慧文率先打响大模型创业潮的第一枪,搜狗创始人王小川、李开复以及周伯文等大佬紧随其后。

5月底,中国科技部发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已经发布了79个。而据不完全统计,到了7月底,已经有116个大模型加入了竞争,互联网企业、创业公司以及高校都有,一场在中国国内发生的“百模大战”就此拉开帷幕。

第二集:百模大战怎么样了?

还记得移动互联网时代的那场“千团大战”吗?那个时候整个互联网圈都在喊“所有行业都值得用互联网重做一遍”,现在“百模大战”开始了,又有人喊“所有行业都值得用大模型重做一遍”。

只要有一个革命性的技术出来,中国就在应用层会快速追上,而这次,是ChatGPT爆火所带来的的AI大模型。

作为ChatGPT的追逐者,C端应用是企业首选的方向。百度“文心一言”、阿里的“通义千问”、商汤“商量”以及复旦大学研发的大模型moss都是对话式语言类的大模型产品。

而除了聊天机器人,办公场景不仅在国际,在国内也是大模型在C端落地的第一站。阿里巴巴的钉钉展示了斜杠“/”功能,能够整理群聊要点、生成海报、成为会议助理等等。在它发布的同一天,WPS也发布了“WPS AI”,在生成内容、阅读理解以及问答等方面的表现也不差。同样作为办公软件的飞书也没落下,推出了“My AI”,可以自动汇总会议纪要、创建报告、优化和续写文字内容等等。

在图像方面,除了百花齐放的各种AI绘画网站,不少主流APP也都加入了AI生图的功能,抖音的“AI绘画”,美图的“WHEE”,还有小红书的“此刻”。然而最先闯出一片天,成为爆款产品的却是一个名叫“妙鸭相机”的小程序,它只需要用户上传20张照片,支付9.9元后,就可以生成媲美影楼的写真图。

不过当ChatGPT网站访问量下降后,一个问题开始出现在这些企业面前:是继续走ChatGPT的路,捞一波快钱?还是要换个赛道?

很快,一个共识就达成了,那就是ChatGPT这样的通用大模型可以满足C端用户娱乐和创作,解决实际问题的能力并不强,最终留下来的只会有两三家。而且,C端产品用户规模大,场景复杂,问题又多,付费意愿也不强,比起B端一个解决问题的场景,模型设计难度高,消耗的算力也多,很不划算。

所以下一阶段的机会,会是面向B端的行业大模型。

4月,阿里巴巴CEO张勇就透露,已经有超过20万企业用户申请接入通义千问的测试,其中新兴和传统行业都有;6月,腾讯云宣布做行业大模型解决方案;7月,华为发布了盘古大模型3.0,“不作诗,只做事”,聚焦矿产、铁路、气象等行业,其中的矿山大模型还完成了商用,正在开发和实施首批应用场景。

除了他们,还有京东、智谱等更多的企业也在陆续加入新战局......

第三集:百模大战往何处去?

任何一个新概念刚出来,一定会有人去蹭概念,这跟我们去蹭热点一样。只不过是换成上市公司和AI。

“百模大战”模型这么多,打得这么激烈,甚至1天内就出现了6个大模型,那要怎么防止它们变成“群模乱舞”?引导和监管是必须的。

在7月上海举办的世界人工智能会上,为了推动大模型技术和标准化的实践结合,促进AI产业健康发展,成立了我国首个大模型标准化专题组,华为、阿里、百度和科大讯飞等企业成为了联合组长单位。而在一周后,《生成式人工智能服务管理暂行办法》也发布了,目的是保护数据安全和引导产业健康发展。

在芯片行业上,我国已经吃了“卡脖子”的亏,因此,在大模型上强调自主可控无可厚非。

而算力、算法和数据是一款大模型研发的三大核心要素,缺一不可。

把AIGC拆分成三层,第一层就是算力,目前芯片厂商英伟达是最大赢家,但与此同时,华为以及国内的一些厂商也在做芯片,华为昇腾AI就是其中之一。第二层是基础设施,不仅仅是芯片,还有存储数据、传输网络、操作系统等,这些是给AI算法工程师使用的软硬件基础设施,到了第三层,就是应用层,最重要的就是数据,面对不同的应用场景,会有不同的数据,这也是大部分大模型之间最大的区别。

而在这场“百模大战”中,这三层都能做好的企业寥寥无几,未来很可能是大企业做多层布局,中小企业则是单层突破。

要我说,未来“百模大战”不会是每个企业都自成体系,做好这三层,让这场大战变成零和博弈,而会是你中有我,我中有你的强强联合。像是华为,在自身有大模型的前提下,它的昇腾AI还为中国约一半的大模型提供了算力。像是科大讯飞的讯飞星火认知大模型就使用了华为昇腾AI的算力。

你可能会问,华为为什么要合作而不是直接对干?一方面,做大模型和提供算力是属于不同层面的路子,合作来搞,可以让专业的人做专业的事,效益更大化;另一方面,合作能够让更多的企业投身大模型市场,共建行业,可以有利于大模型这个新兴市场的开拓。

就好比说,你做出来了一个葡萄披萨,结果大街上只有你这一家店,别人都不知道你卖的新东西有没有问题,就不太敢去尝试,你没有被选择的机会;但是如果街上开了挺多家跟你一样的店,大家就会觉得葡萄披萨是有市场的,至少吃了不会有事,也就愿意去尝试,你也就有了被选择的机会。

现在来看,“百模大战”场景多元、行业共建、产业共建等趋势越来越明显,表面看似激烈,但最终很多企业都可以在算力、算法和数据等层面和各种应用方向上找到各自的定位。是属于不同层面的路子,合作来搞,可以让专业的人做专业的事,效益更大化;另一方面,合作能够让更多的企业投身大模型市场,共建行业,可以有利于大模型这个新兴市场的开拓。

来源:新火种-AI资讯媒体网站www.xhz.cn

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多