分享

影智科技唐沐:人形是累赘,具身智能并不缺少落地场景

 新用户84877682 2024-12-19 发布于浙江

影智科技创始人唐沐认为:具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的“人形”。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求。

撰文张贺飞
编辑沈菲菲

马斯克、黄仁勋等人的站台,让具身智能迅速蹿升为2024年最受资本追捧的赛道之一。

复盘具身智能赛道过去一年融资事件,人形机器人是出现频率最高的词。或许是受《机械姬》、《西部世界》等科幻作品的影响,人们本能地认为具身智能应该拥有双手双脚、面部表情等设计。

但影智科技创始人唐沐对此并不认同:“具身智能在产品设计上应该解决特定需求,而非单纯追求形式上的’人形’。当前市场对人形机器人的追捧更多是概念化,而非实用主义。

作为QQ头像、微信表情包等现象级符号的缔造者,小米路由器、小爱智能音箱等亿级爆款产品的掌舵人,唐沐以其敏锐的洞察力和创新的产品思维,打造了一系列国民级产品。

与那些还处于实验室状态、“吊着威亚”展示的人形机器人不同,影智科技的xbot咖啡机器人已经是各种科技展会上的明星,每次体验机器人制作咖啡的观众都排起了长队。


具身智能为什么必须回归需求导向?这种理念为机器人带来了哪些颠覆性的改变?又有哪些成功落地的应用场景?带着这些问题,我和影智科技创始人唐沐进行了一场深度对话,尝试打破外界的刻板印象,找到通往具身智能正确答案。

01.
机器人的进化路径:
不是从“像人”开始,而是“更有用”

2023年走进大众视野的具身智能,正处于“八仙过海” 的时期,吸引了一大批用人形机器人求解具身智能的创业者。

而支撑他们投身人形机器人的动机,可能只是一场不确定的“风”:当马斯克开始做人形机器人之后,市场、资本机构都认为必须加快入场,不能等特斯拉真正做出来了大家再去追。

有着20多年产品经验的唐沐,并不苟同这种追风现象。

2003年,唐沐加入腾讯,着手组建了腾讯用户研究与体验设计中心(CDC),负责QQ、QQ电脑管家、QQ音乐、QQ空间等亿级用户的产品体验设计。外界所熟悉的QQ头像、微信表情包等均出自唐沐之手。

2013年,本着“做一款自己的产品”的想法,唐沐加入小米,历任智能产品部总经理、小米生态链副总裁,带领团队开创了小米路由器、小爱音箱两条亿级产品线,以及VR、AR、机器人等领域的技术探索。

多年后,唐沐离开小米创办了影智科技,天使投资人名单中不乏微信之父张小龙、小米联合创始人林斌、黎万强、黄江吉、洪锋等外界耳熟能详的人物。


影智科技的标杆产品,正是前面提到的xbot咖啡机器人。彼时,唐沐就意识到,机器人需要遵循技术的底层逻辑,在正确的时间做正确的事,而非奔着一个遥远的目标给投资人画饼。

这样的履历,让唐沐有足够的底气选择不盲目追风,坚持自己对具身智能趋势的理解和洞察。

当其他创业者为人形机器人枕戈待旦时,堪称“国内具身智能消费机器人第一人”的唐沐,没有沉溺于对人形机器人的空洞想象,理性地讲述了自己对机器人演进路径的独到见解:

X1阶段是工业机器人,强调动作的人工编排,用于工厂内的高度结构化任务;

X2阶段是消费机器人,结合人工与AI进行任务编排,比如学习咖啡师的技艺训练机器人的拉花技巧;

X3阶段是具身智能消费机器人,拥有视觉、听觉、触觉等多模态感知能力,可以基于用户的个性化信息,结合消费场景和用户进行深层次互动,进一步提升服务质量和灵活性;

最后一个阶段才是AGI机器人。


和人形机器人广泛而模糊的目标不同,唐沐认为:机器人的进化路径,不是从'像人’开始,而是从'更有用’出发。具身智能的真正价值,在于以具体问题为导向,让机器人能够灵活适应环境、精准满足需求,这才是技术发展的正确方向,就像让机器人做咖啡。

相比人形机器人在舞台上比心、跳舞等“炫技”,影智科技的xbot咖啡机器人让人记住的,是实打实的“新质生产力”:能够在75秒内复刻大师级的拉花咖啡技艺。


2021年举办的黑杯咖啡大师竞技赛上,xbot咖啡机器人和世界级拉花咖啡师同台竞技,并最终摘得了冠军。由于人类咖啡师的集体抗议,xbot咖啡机器人在第二年“被迫”当了评委。主办方先让xbot咖啡机器人做一杯拉花咖啡,然后让人类咖啡师还原,并根据完成度评分。

现在,xbot咖啡机器人已经不单单是效率上的降维打击,在大模型的赋能下重新定义了服务边界——从生产力工具跃升为兼具情感互动与个性化服务的咖啡智能体。

02.
具身智能的现实价值:
不是形态上像人,而是思维上像人

在星巴克的品牌故事里,有一个重要的理念是“将顾客作为朋友”,咖啡师熟悉每一位顾客的名字和喜好,甚至在顾客进门前就准备好了他们常点的饮品,以此给予顾客在家和工作之外的归属感。

但在中国市场,这种归属感早已输给了人效二字:被一杯杯订单忙到喘不过气的咖啡师们,很难有精力和顾客建立有感情的沟通。咖啡店拼的是出单量和运营效率,而非顾客的体验感。

在唐沐看来,这正是具身智能的现实价值。

“X2阶段的机器人已在效率上实现对人工的降维碾压,而大模型的多模态感知与认知推理能力,将重新定义咖啡消费,不仅赋予了咖啡人情味儿,还拓展出了全新的消费场景。”

影智科技自研的xbot咖啡大模型已经应用到三类消费场景中,完美诠释了唐沐的理念:


一是AIGC“烘托”的仪式感和氛围感。

除了大师级的拉花技艺,xbot咖啡大模型带来了独一无二的咖啡体验:顾客可以扫码上传自己感兴趣的照片,通过AIGC技术生成自己喜欢的图像风格,让咖啡机器人用焦糖在奶泡上打印出相应的图案。


一杯咖啡满足的不再只是“提神”的需求,也是一种社交资本:情人节给女朋友买一杯印有玫瑰花图案的咖啡,在景点打卡时咖啡上印有刚拍的风景……让喝咖啡更有仪式感,并激发出消费者的社交需求。

二是多模态感知能力带来的情感体验。

当顾客走到咖啡机器人前点单时,可以智能识别用户身份和口味偏好,自动切换到顾客喜欢的数字人形象,而且数字人会主动和顾客打招呼,并推荐顾客可能感兴趣的咖啡品类。


在用户允许的情况下,咖啡机器人甚至可以通过声音和表情实时感知顾客的情绪状态,比如顾客表现出疲倦或情绪低落时,建议顾客多加一些糖来保持好心情,或者调整咖啡因浓度帮助用户提神。

三是千人千面的消费需求和健康管理。

得益于xbot咖啡大模型的认知推理能力,基于顾客消费数据的个性化消费知识图谱,顾客只需要一个类似“做一杯热带风情”咖啡的指令,咖啡机器人能够自动创作出符合顾客需求的咖啡,让顾客的需求不再局限于已有的菜单,而且能够根据自己的想法个性化定制。


xbot咖啡大模型还能为顾客制定健康管理方案,比如了解到顾客连喝了三杯咖啡后,推荐喝一杯有利于健康的乌龙茶。

如果说人形机器人追求的是形态上像人,唐沐的理念是思维上像人,让具身智能机器人像人一样和顾客打招呼,像人一样关心顾客的情绪。

唐沐进一步解释称:“具身智能还没有终极的答案,不代表没有可以参考的路径,譬如十年前的自动驾驶,如果按照当时预期的终极目标,到现在也没有实现,但并不妨碍L2.5、L3级别的自动驾驶能力上车。具身智能从发展到成熟的过程中,也存在大量可落地的场景。

摆脱了“炫技”等表面追求的xbot咖啡机器人,可能不如人形机器人有话题性,却构建了更贴近消费场景的具身智能生态,打造出了更贴近当前社会需求高度契合的真实图景。

03.
遵循商业化常识:
人形可能会是累赘,优先解决高频刚需

对于具身智能的市场前景,外界有不少判断。

高盛曾预测称,在理想状态下,软硬件成本年均下降达到20%的话,人形机器人市场规模有望在2035年达到1540亿美元。

黄仁勋在媒体采访中坦言,“100年后大街上将到处都是人形机器人”,马斯克也在X上默契地回复,“人形机器人普及程度将是汽车10倍”。

面对具身智能的商业化问题,有别于动辄十年后、百年后的长远叙事,唐沐用一组掷地有声的真实数据给出了答案:

“目前xbot咖啡机器人在全球部署超过300台,包括博物馆、景区、商场、展会、图书馆等场所,两周前刚落地到70家万达影城。每台咖啡机器人日均制作的咖啡在200杯以上,最高的时候超过了350杯。仅在过去一个月,我们的营收已经超过2000万元。”

正在大规模量产的xbot咖啡机器人

唐沐对具身智能机器人的商业化构想,也随着xbot咖啡机器人的落地得到了充分验证。

比如在2023年成都大运会期间,成都的一家公司将xbot咖啡机器人“搬”到了大运会的运动员餐厅,24小时不间断运营。期间吸引了不少运动员拍照打卡,不乏意大利、巴西等对咖啡要求很高的国家的运动员。后台统计数据显示,xbot咖啡机器人在12天里做了4000多杯咖啡,主办方全程只安排了一个志愿者负责换料。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多