k8凯发天生赢家

全球第一！智元斩获WorldArena世界模型总分冠军！

大象新闻记者刘幼玉

作者：黄雅慧

颁布功夫：2026-06-01 13:31:07

阅读量：5974

全球第一！智元斩获WorldArena世界模型总分冠军！

大象新闻记者刘幼玉

近日，具身领域热点榜单 WorldArena Track1(世界模型感知与作为响应赛路)最新评测了局揭晓。智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称GE 2.0)凭借优异的综合阐发，登顶榜单榜首。

“世界模型感知与作为响应”赛路聚焦具身智能最性质的“认知与行动”能力，是评价通用人形机械人智能化水平的主题标尺。在该赛路评测中，智元团队使用了原生的世界模型GE 2.0，并未针对赛题进行特殊设计优化，仅基于榜单数据进行了基础微调(Finetune)。“轻装上阵”依然拔得头筹，充分印证了GE 2.0壮大的通用适配性。面对近期世界模型方向的火热关注和创衣匪潮，智元始终维持自己的节拍，从长远第一性道理启程，专一于打磨具出身界模型的坚实技术底座。这次登顶，是智元对峙持久技术演进的实力见证。

在GE 2.0技术汇报中，智元团队对模型进行了全面的能力分解。相比上一代模型，GE 2.0不仅在单点机能上实现了跃升，更真正演进为一个全职能、高可用的世界仿照器，可构建可试错、可迭代、可进化的虚构仿真环境，让机械人战术在虚构场景中自主堆集经验、实现动态试错，躲避真实场景的试错成本，最终高效迁徙至真实物理世界不变落地，真正实现从“感知预测”到“仿真进化、自主决策”的关环升级。

职能矩阵全面补齐：GE 2.0在职能上初次全面覆盖了长时序天生、多视角天生、本体状态天生、近实时推理以及嘉奖判断等主题环节，构建了世界仿照器齐全的技术能力关环。

长时序推演能力突破：在长时序推理工作中，GE 2.0阐发出极强的不变性，画面质量随推理时长的衰减显著弱于行业基线规划。即便在陆续推演 40-50 秒的长视频片段时，其天生质量依然超过了基线模型前 10 秒内的阐发。

高靠得住的关环评测：作为世界仿照器，主题在于能否真实反映物理世界。团队验证了大量关环评测了局，证明GE 2.0在多项工作上均与真实世界维持着强有关性。这种有关性不止步于宏观统计意思上的“成功率一致”，团队还进行了逐案(Case-by-case)的 rollout 了局对比分析，并通过混合矩阵(Confusion Matrix)提供了严谨的量化佐证，强有力地证了然GE 2.0作为战术评测器的靠得住性。

买通数据回流反哺机造：在嘉奖模型(Reward Model)的加持下，GE 2.0可能对关环评测的 rollout 过程进行自动化筛选，将世界模型中产出的有效高质量数据精准回流给战术模型(Policy Model)。尝试证明，这一机造在多项工作上均助力战术模型实现了显著的机能涨点。

2026年是具身智能“部署态”元年，机械人从尝试室走向真实场景，规；渴，真正阐扬具身智能出产力，这也对算法提出了更高的要求。专一底层技术攻坚与产业价值落地，是智元一贯的技术理想。不论是WorldArena榜单上的优异阐发还是技术汇报中的机能论证，都彰显了Genie Envisioner技术路线的潜力。将来，智元将持续迭代世界仿照器技术系统，买通具身智能技术关环，推动世界模型真正走进真实场景，为人形机械人规；涞刂牢主题技术底座。

附： 7Project page: https://ge-sim-v2.github.io/

Arxiv：https://arxiv.org/abs/2605.27491

Github：https://github.com/AgibotTech/GE-Sim-V2

　

【编纂者：黄崇吉】

有关标签

中国的数据必须由中国人把握在华庆祝“欧洲日” 欧盟强调持续对话与合作原创越剧《女儿红》首演讲述酿酒人的家国情济川药业蒲地蓝消炎口服液获批中药；ぶ掷

文章点评

未查问到任何数据！

颁发评论

◎迎接参加会商，请在这里颁发您的见解、互换您的概想。

【网站地图】