机器人正逐渐
褪去“科技味”
生出“人情味”
7月27日,海淀人工智能大模型企业商汤科技在2025世界人工智能大会(WAIC)上发布日日新V6.5多模态大模型及“悟能”具身智能平台,推动机器人与现实世界的智能交互迈上新台阶。
“悟能”为机器人提供交互能力
据悉,“悟能”具身智能平台以商汤具身世界模型为核心引擎,依托商汤大装置提供端侧和云侧算力支持,能够为机器人、智能设备提供强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化演进。
“悟能”具身智能平台
可赋能机器人等各种终端硬件
并支持嵌入到端侧芯片
具有强大的场景适配性
现场,商汤科技董事长兼首席执行官徐立展示了搭载具身世界引擎的人形机器人讲解“长安的荔枝”PPT的效果,其语言自然、风趣幽默,不仅可以自动翻页,还能回答各类问题,并进行阶段性小结。
商汤具身世界模型能够生成多视角视频,并确保良好的时间一致性和空间一致性,让机器能够理解、生成、编辑真实世界,在空间层面实现世界交互,让“在真实的街道场景中玩‘极品飞车’”成为可能。
商汤具身世界模型还能构建面向人、物、场的4D真实世界。用户仅需要输入简单的提示词,比如“在厨房区域的架子上找东西”“进入娱乐室、向右转,然后打开通往院子的门”等,具身世界模型就能自主进行位姿、动作骨架和指令的生成。
“希望‘悟能’具身智能平台能够帮助各种具身智能企业完成和现实世界交互的梦想。”徐立说道。
大模型让机器人充满“人情味”
在大会展览区域,商汤科技展区人潮涌动,热度持续攀升,相机快门声、互动讨论声此起彼伏,犹如一场AI科技潮流盛宴。
在展区中央,搭载商汤最新日日新V6.5多模态大模型的人形机器人最为吸睛。从自然流畅的PPT讲解,到生动趣味的交流对话,在多模态能力的加持下,机器人正在逐渐褪去传统“科技味”,真正充满“人情味”。
工作人员告诉记者,日日新多模态大模型(SenseNova)是商汤科技推出的大模型体系,全新升级的日日新6.5多模态大模型进行了模型架构改进和成本优化。
现场展示了基于商汤日日新大模型的各类原生AI应用,包括商量、办公小浣熊、咔皮记账等,它们不再是单向的“信息灌输工具”,而是已经能够真正解决问题,成为办公、理财、金融、医疗等领域提高生产力的“贴心助手”。
“我们的多模态推理与交互性能大幅提高,而成本大幅下降,只有原始的30%,但能带来5倍性能的提升。”徐立说道。
此次“悟能”具身智能平台与日日新V6.5多模态大模型的发布,不仅展现了商汤科技在具身智能与多模态大模型领域的前沿探索,更通过显著提升交互性能与大幅降低成本,为机器人和智能终端赋予更强的环境理解、自主决策与自然交互能力,有力推动具身智能技术迈向大规模应用的新阶段。
相关人物