就算是自己没去,身边至少也有那么几个朋友已经在上海了。 2023世界人工智能大会于7月6日-7月8日在上海世博中心及世博展览馆举办,无论是参展企业数量还是展览面积,今年的大会均创历届之最。 这届“AI春晚”的主题是“智联世界 生成未来”。 五万平米的场地里,萦绕着对大模型、生成式人工智能、科学智能、具身智能、元宇宙等沿话题展开前瞻性探讨,以及“智变”后人类文明的下一个可能。 (机器人现场跳《隐形的翅膀》) 多知连刷两天,看到了大模型在教育场景的落地,比如口语老师、比如绿色教室;得到了AI写的诗、看见了AI的毛笔字,还问了AI两道题;为机器人跳舞鼓掌、在虚拟主播卖酒的屏幕前心动了两秒、在智能操场玩立定跳远、在天文馆看见了不一样的月球…… 科技真是动人。 01 AI向上,应用落地 商汤:教练,我想打篮球 今天,商汤宣布商汤日日新(SenseNova)大模型体系全面升级。 其中,基于日日新的千亿参数语言大模型商量2.0(SenseChat)基础能力教过往有了大幅的提高,商汤CEO徐立在现场展示了用这两个模型展示了一波“孔子对话老子”的情景。 而基于商汤日日新SenseNova大模型,商汤推出的自研生成式AI应用“商汤秒画SenseMirage”、“智慧篮球场SenseShot”也出现在人工智能大会现场。 (商汤秒画现场展示,关键词“水仙 油画”) SenseMirage,据现场工作人员介绍,商汤自研的AIGC文生图大模型拥有超10亿参数,支持二次元、三次元等多种生成风格。 用户不需要复杂的编程知识,只需给定提示词,即可生成相应图像,最高可实现6K高清图。 (智慧篮球场在分析上一个进球情况) SenseShot,智慧篮球场是基于商汤视觉大模型体系打造的多相机视觉动作捕捉系统。 智能球场可以在enseShot(智胜时刻)小程序上进行运动分析展示,进而实现无人化赛事直播、智能化高光时刻抓取、瞬间生成,技术数据统计,动作分析判断等等。 依托于现场架设的高级传感器和摄像头,通过2D关键点提取和3D视频动作捕捉等技术进行球场3D建模,系统会自动捕捉人脸/人体的29个关键点和篮球,进行单人/多人的逻辑计算和分析。 这也将为球员提供详细的数据和统计,以帮助分析和改善篮球技术。 商汤元萝卜AI下棋机器人也出现在展会现场。 (元萝卜围棋机器人) (元萝卜象棋机器人) 有道:和虚拟老师聊聊天 今年3月,网易有道便宣布推出国内首个教育场景下类ChatGPT模型“子曰”。“子曰”取名自我国教育先贤孔子的教育理念,“夫子教人,各因其材”。 “子曰”最新应用成果虚拟人口语教练在这次大会上首次亮相。 (图片来源:网易有道) 虚拟人口语教练可以配合用户进行开放式的自由对话,畅聊各种话题。当用户不知道聊什么时,教练提供“互相介绍”、“讨论天气”、“求职面试”、“心理健康和幸福”等几十种话题以供选择。 “I'm sorry to hear that. Have you ever experienced something like this before? ”大会现场,虚拟人口语教练跟用户正在进行一场心理相关的话题互动。 (有道AI虚拟老师) 它不仅能够针对练习者的回答提供情感反馈,还可以主动抛出问题,小幅度转换话题,从而引导对话持续进行。 多知了解到,包括虚拟人口语教练在内的“子曰”大模型系列应用成果发布会将于7月26日召开。届时,中文作文指导与批改、英语习题精讲等多种教育领域细分应用成果将呈现给公众。 蜜度:为你写诗 以 AI 技术为核心的语言智能科技企业蜜度,在7月6日当天发布了自主研发的3个行业领域AI大模型,应用于出版、媒体、政务、教育等行业。 其中,有用于辅助写作、新闻稿件辅助生成的蜜巢知识问答与内容生成大语言模型;有国内首个智能校对领域大语言模型“蜜度文修”;还有蜜巢智能舆情分析大语言模型,以及旗下生成式 AI(AIGC)应用产品“蜜小豆”、“文稿通”。 (AI明信片正在打印) 蜜度在展台现场展出了“AI明信片”“AI游中国”“为你作诗”多个AIGC沉浸式互动体验。 “为你作诗”互动则围绕输入的关键词,让AI自动完成现代诗的创作,并打印为“藏品”。蜜度文稿通不仅能“作诗”,还具有包括公告、新闻稿等在内的特定文体的撰稿能力。 (根据多知的关键词所给出的小诗歌) 蜜度首席技术官(CTO)刘益东对媒体表示,接下来蜜度团队将全面打造蜜巢行业基座大语言模型,预计2023年底前,蜜巢将实现百亿级别参数、千亿级Token以及聚焦行业场景的泛化能力。 腾讯:去看看山水,再作一首曲 腾讯多媒体实验室本次在展区呈现四个可互动的现场体验项目:XMusic、腾讯水墨画、全景“云”游东北虎豹国家公园、虚实融合产品。 此次入选“镇馆之宝”的XMusic生成式通用作曲框架,基于AIGC技术,支持视频、图片、文字、标签、哼唱等多模态内容作为输入提示词,生成情绪、曲风、节奏可控的高质量音乐。 (图片来源:腾讯) 多媒体实验室还展出了前沿技术方面的三个项目;"全景'云'游东北虎豹国家公园”通过自研技术智能影像处理和自研VR360解决方案供所有人在“云端”走进这片山林秘境;“虚实融合技术”产品,可将传统虚拟制片的成本与难度大幅降低,无需传感器,只通过一台相机或手机,就可将自己植入到虚拟世界中;“腾讯水墨画”产品融合了视觉、音乐、文字等多种模态,结合山水画创作、智能作诗、音乐生成等多种技术能力,形成了多模态融合且能互动娱乐的完整技术方案…… “云游长城”是全球首次通过照片扫描建模、云游戏、PCG自动化生成等多种游戏技术,实现最大规模文化遗产毫米级高精度、沉浸交互式的数字还原。 本次展会上,腾讯游戏打造了“数字长城”裸眼3D全息投影展陈,参观者以更加趣味化的方式深入了解长城的神秘和文化底蕴,感受数字化和文物保护的完美融合,实现真正的沉浸式交互。 腾讯云智能和腾讯优图实验室重点展示了小样本数智人、刷掌支付、腾讯同传等现场互动体验项目。 (图片来源:腾讯) 腾讯云智能可在现场实时复现小样本数智人生产过程。依托于腾讯自研AI能力,只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。 在“刷掌支付”展区,参观者只需将手掌置于识别区上方2-3秒,即可通过目前最先进的“掌纹+掌静脉”识别技术进行支付。 (参观者正在体验掌纹识别) 腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,人工智能发展的根本目标是落地于产业,服务于人。能真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。“腾讯将携手各方伙伴,以优质模型、澎湃算力,让每个企业的'黄金数据’发挥出高效用,助力产业创新发展。” 百度:以“一”生万 在百度展区,当用户将一连串需求输入对话框,他眼前的文心一格就生成了数张符合要求的图片。 (文心一格) 文心一格是百度推出的AI艺术和创意辅助平台,是百度依托于飞桨、文心大模型持续的技术创新,在“AI作图”方面发布的产品和技术工具。定位为面向有设计需求和创意的人群,基于文心大模型智能生成多样化AI创意图片,辅助创意设计,打破创意瓶颈。 在工作人员的展示下,只需输入文字描述,文心一格就能快速生成各种风格的精美画作。 从“一格”到“一语成画”,是如何实现的?核心在于文心跨模态大模型技术,这是百度自主研发的产业级知识增强大模型。 华为盘古:只做事 华为终于公布了盘古大模型的最新消息——3.0来了。 华为常务董事 、华为云 CEO 张平安在华为开发者大会上表示:“自 2017 年 transformer 架构提出以后,在一些领域,新的架构已经开始解决通用性问题,AI 进入了大模型时代。国内上半年陆续发布了 80 余个 AI 大模型。” “我们注意到了它们都有很好的对话能力。但我要说,盘古大模型不写诗,只做事。盘古大模型的目标是利用 AI 技术给各行业带来价值。” 据了解,3.0 版的盘古大模型是一个面向行业的大模型系列,具有「5+N+X」三层架构::从 AI 能力的基础层,到行业的第二层,再到应用层面向场景的各个接口,华为围绕深耕行业面向开发者持续打造了新的竞争力。 (图片来源:华为) 在昨天的 WAIC 大会上,华为轮值董事长胡厚崑表示,ChatGPT 的出现把 AI 推向了新的风口,人工智能将帮助改写身边的一切。华为现在的核心目标是在下个阶段,全力推进人工智能走深向实。 (图片来源:华为) 此次华为展台的昇腾AI“大模型超级工厂”亦广受关注。 据华为相关负责人介绍,昇腾AI“大模型超级工厂”从大模型的数据&模型准备、算力准备&模型训练、模型部署上线&集成等阶段全流程赋能大模型的开发与应用创新。 目前基于昇腾AI原生孵化了业界首个两千亿参数的中文NLP大模型鹏城。盘古、业界首个多模态大模型紫东.太初以及华为云盘古系列在内的20多个国产大模型。 同时,昇腾AI也已适配支持了ChatGLM、LLaMA、GPT-3、BLOOM等数十个业界主流开源开放的大模型。 蚂蚁:还没成型,但很坚定 (AI课堂) 蚂蚁安全实验室展示区出现了AI课堂的身影。展区负责人对多知表示,这款产品暂未落地,但蚂蚁计划围绕AI评测、有害内容等方向进行设计。 蚂蚁集团副总裁、数字科技解决方案总经理余虎表示,面对日益增长的数据需求,在高质量数据集建设和治理方面,蚂蚁集团有三个较关键的举措: 一是在金融领域长期积累,并成立一支较大规模的投资标准; 二是开发数据价值的评估技术,实现数据质量的反向评估; 三是与高校合作,研究开发区块链技术的大规模分布式数据的可信制度。 金山办公:办公软件越来越聪明 金山办公在人工智能大会上推出了基于大语言模型的智能办公助手 WPS AI,WPS AI 官网(ai.wps.cn)同步上线,同时开启招募智能办公体验官的通道。 WPS Office 个人用户和 WPS 365 企业用户均可申请。 (金山办公) 金山办公 CEO 章庆元表示,金山办公将 WPS AI 定位为大语言模型的应用方,未来锚定 AIGC(内容创作)、Copilot(智慧助手)、Insight(知识洞察)三个战略方向发展。 据介绍,WPS AI是金山办公AI产品的暂时代号,其中涵盖了包括文字内容生成、PPT生成及美化、文档阅读理解、表格操作等方面的功能,从产品形态来看,类似ChatPDF、ChatDoc类的文档内容问答、一键生成PPT及字体、主题美化、表格操作及数据分析、文字内容生成及总结摘要等都会包含在WPS AI的产品范围内。 美团:空投到了 (美团第四代无人机) 美团无人机第四代新机型首次公布和亮相,该机型是专注于城市低空物流配送场景的全新多旋翼机型,最大配送距离约为5公里,较上代提升近35%。 同时可在“中雨和中雪”中安全执行配送任务,能够适应97%以上国内城市的自然环境要求。 02 当大模型做高考题 2023年北京高考语文作文题“微写作”部分的第三题中提到:请以“心跳得那么快”为开头,写一首小诗或一段抒情文字。题目自拟。要求:感情真挚,语言生动,有感染力。 多知在现场随机测试了几款大模型,摘取了它们的部分回答。 商量——商汤科技旗下的中文语言大模型应用平台。 心跳得那么快,像是鼓点般节奏分明; 仿佛每一次跳动都在告诉我,此刻的爱恋正在沸腾。 每当看到你的微笑,心就忍不住跳个不停; 仿佛整个世界都静止了,只剩下我的心跳声。 文稿通——密度生成式 AI(AIGC)应用产品。 心跳如此之快 仿佛时间停滞 心潮澎湃汹涌 无法抑制情绪 思绪如风般飘荡 通义千问——阿里巴巴旗下超大规模语言模型。 心跳的那么快,像是在跳动的火焰, 我的心脏在胸腔中跃动, 一颗年轻的心,充满了渴望和激情, 它在呼唤着未知的冒险和未来的希望。 星火——科大讯飞认知大模型。 心跳得那么快,仿佛就要跳出胸膛。 我站在人生的十字路口, 迷茫而又不安。 我不知道该往那个方向走, 也不知道自己是否能够成功。 但我是知道,只要努力奋斗, 就一定会有一片属于自己的天空。 序列猴子——出门问问大模型。 心跳得那么快 我在想着你 时间似乎也在加速 我的心跳声越来越响 每一次的跳动 都让我更加想念你 想念你的笑容 想念你的呼吸 文心一言——百度新一代知识增强大语言模型。 心跳得那么快,快的仿佛要跳出胸膛, 在这充满激情的瞬间,我感受到了生命的疯狂。 空气中弥漫着你的气息,每一次呼吸都带着颤抖, 我默默地起到,愿这份激动能持续得更久。 多知点评:从内容来看,大家都很浪漫,不过好几位的心都跳出的胸膛,这的确是没想到,大模型的爱,好炽热。 03 三大运营商偏爱体育? 联通:上海天文馆,近在咫尺 上海联通与上海天文馆、临港管委会以元宇宙“时光机”理念构建数字孪生平行世界,推出了全国首个天文科普元宇宙案例。 点击屏幕上的季节、时间、天气,我们能看到无论春夏秋冬、白天黑夜、阴晴雨雪中的上海科技馆外观,甚至可以一睹难得一见的冬日雪景、夏至光环。 (上海天文馆) 在元宇宙中,游客既能复刻天文馆的各条参观路线,能随时切换到馆内任何点位,甚至周边的滴水湖、上海市。 “数字一大”元宇宙应用场景以“数字空间”“数字服务”“数字运营”“数字安全”为主要建设内容。 (数字一大) 相关负责人介绍数字一大未来将实现四个“首”:首次实现元宇宙中的“三会一课”;首次元宇宙诠释“伟大建党精神”,打造沉浸式空间;打造首个青少年红色元宇宙教育及互动平台;打造首个大规模跨地域红色元宇宙,串联各地红色纪念地。 移动:来,跳个远吧! 中国移动的展区中,有一个部分吸引了不少学生。 AI元宇宙课堂旁边,有一位虚拟人老师正在授课。 (元宇宙课堂) 模拟和仿真技术的加入,一方面让学生在虚拟世界中进行各种实践和实验,可以提供更加个性化和互动的学习体验,帮助学生更好地理解和掌握知识。 另一方面,在课堂中通过数字孪生教师辅助真人教师,真人教师通过语音与数字孪生教师进行交互,数字孪生教师通过背后的AI教学引擎完成课件资源的调取、课堂即时反馈数据的收集、教学内容的讲解和学生生成性问题的解答,帮助真人教师增效减负。 (小观众现场跳远) 活动现场还有智慧体育整体解决方案。 这套方案在智慧体育校园、区域体考/体测和区域管理决策三大用户领域,提供云+端5种不同产品形态,落地于N个用户应用场景解决相应特定难题。 智慧体育大屏支持炼、教、测、赛四种模式,可为用户构建体育数据闭环;智慧移动站应用于各类测试,智能精准,能高效保障考试公平公正。 (智能骑行) 此外,多知观察发现,中国移动(成都)产业研究院(后文简称“成研院”)展示了自主打造的智慧体育小程序+智能跳绳产品。 智慧体育屏具有锻炼、教学、测试、赛事四种模式,可以让学生在无教师指导的情况进行体育锻炼。锻炼内容除了立定跳远、跳绳、引体向上等多项中考、国家体质健康监测测试项目,还能支持学生进行双人对战和趣味训练。 电信:大模型来了 就在刚刚,中国电信数字智能科技分公司(以下简称:电信智科)正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。 以大模型+智慧政务产品为例,TeleChat大模型依托5G消息,为政务客户提供政务短信智能化多轮问答,进行行业领域的基础语言模型训练和领域问答能力微调,并基于领域问题反馈的强化学习,最终实现对行业领域专业问题的精准回答和平台推反馈。 (图片来源:电信) 电信展区同样突出了智慧体育的产品布局。 (AI体育锻炼) 04 机器人越来越聪明 特斯拉:能单手举钢琴,也能剪草坪 大会开幕式上,特斯拉CEO马斯克曾表示:“未来我们将拥有大量的机器人,长此以往,机器人与人类的比例会是多少?这一数字似乎在某个时候会超过1比1。在拥有大量机器人的未来,全球的生产效率将会提高到令人难以置信的水平。” (马斯克) 特斯拉参展带来了Model Y和Model X两款车型,向观众展示了特斯拉完全自动驾驶能力(FSD)以及Dojo超级计算机等智能化最新进展,而且还在现场展示了Tesla Bot人形机器人——擎天柱(Optimus)。 “此次展出的机器人是概念机器人,大概3年-5年后量产,目前仍处于研发阶段,其底层芯片技术跟特斯拉Model Y基本是同步的。”相关负责人在现场介绍到。 该人形机器人身高172cm,体重56.6kg,就是一个正常成年人的身形。机器人全身拥有28个自由度,就如同人体的关节,其手部有11个自由度,可以更加灵活的抓握,且力大无比,可以单手举起一台钢琴。 (Optimus) 这款人形机器人可以完成行走、上下楼梯、下蹲、拿取物品等动作,也已经具备保护自身和周边人安全的能力。据介绍未来还可以做饭、修剪草坪、帮助照看老人,或是在工厂里替代人类从事枯燥和有危险的工作。 因为他搭载了与特斯拉汽车一样的具有全自动驾驶能力的电脑和视觉神经网络系统,在Dojo超级计算机的加持下,同样可以利用动作捕捉来“学习”人类。 傅利叶:将来打算搞科研 傅利叶智能在此次大会上发布了最新研发的通用人形机器人GR-1。 (傅利叶机器人) 作为国内自研可商业化落地的通用人形机器人产品,GR-1展现出的技术突破引发业界关注。在外骨骼机器人的研发过程中,傅利叶智能沉淀了传感器、模块化设计、一体化执行器、仿生机械结构等底层技术。 穿上“铠甲”,患者可以在机器人的“搀扶”下缓步前行。 尤其在执行器关节领域更是具备核心优势,GR-1能够与人协同完成动作,在工业、康复、居家、科研等多应用场景潜能巨大。 达闼:角色扮演很在行 达闼机器人展台上的多台充满未来感的具身智能机器人,全部接入和升级了达闼最新发布的RobotGPT、海睿AGI和海睿OS5.1,智能化水平与人机交互方式相当出彩。 其中,达闼自主研发的人形机器人小姜,在接入RobotGPT之后,不仅能与观众展开“有问必答”的对话,而且还能扮演多种角色。 (达闼机器人演唱张韶涵的歌曲) 机器人现场表演张韶涵《隐形的翅膀》。 (排排站) 据了解,达闼在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。 与此同时,达闼做出了云端机器人是“人类的第三台计算机”的重大判断,看好其在未来的巨大发展前景,全力打造健康发展的云端机器人产业生态。 声智:提笔写字,稳 (展台内展示机器人毛笔字书写) 现场还有关于“小易写作”的介绍。 “小易写作”是一款AIGC写作应用(AIGC是指人工智能通过已有数据寻找规律,并自动生成内容的生产方式)。 (小易写作主页) 使用“小易写作”,只需输入关键词或主题,便能自动生成高质量内容,为用户提供包括祝福语创作、公文写作、营销策划等多领域创作模板,用户通过简洁的提示语和操作界面,可以快速实现智能化写作,多功能文本编辑,个性化定制内容。 优艾智合:高原科考很在行 优艾智合的新品机器人ARIS-8848曾攀登珠峰,也成为世界智能大会现场最硬核的代表之一。 (走,去爬山!) 去年五月,为了保障气象科考队在珠峰的气象考察工作,优艾智合基于巡检机器人的技术框架和商用案例积累,花费一年进行产品设计与打磨,推出了高原科考机器人ARIS-8848。 针对青藏高原的高海拔、超低温和复杂地形,ARIS-8848拥有履带式的移动底盘,可以在沙石、冰川等复杂路面运行,同时机身集成包括3D摄像头、激光雷达、红外摄像仪在内的多种传感器,能够识别复杂地形和障碍物。 …… 明天,世界人工智能大会将落下帷幕,但中国的智能风,还在继续。 END |
|