中国数智化转型网 人工智能资讯 每日人工智能资讯|英伟达联合清华推出 Gamma-World,打破多智能体虚拟仿真天花板

每日人工智能资讯|英伟达联合清华推出 Gamma-World,打破多智能体虚拟仿真天花板

视频世界模型正迎来从单人视角向多人协作的底层变革。传统的视频世界模型大多建立在单智能体假设之上,难以应付多个玩家在同一虚拟世界中同时操作、互相观察的复杂场景。为了打破这一架构瓶颈,英伟达联合清华大学、多伦多大学及 Vector Institute 正式发布了名为 Gamma-World(γ-World)的全新多智能体世界模型方案。数智化转型网www.szhzxw.cn

多智能体世界建模的核心难点在于同时维护时间、跨视角以及交互的三重一致性。以往的研究如 Solaris 虽然在双人协同上取得了进展,但暴露出身份编码破坏置换对称性、全连接注意力机制导致计算量随人数平方级暴涨这两大核心缺陷,无法真正扩展到更多主体。数智化转型网www.szhzxw.cn

针对这些结构性缺失,Gamma-World 从底层组件入手进行了重新设计。首先,团队创新性地提出了“正单纯形旋转智能体编码(Simplex Rotary Agent Encoding)”。通过将所有玩家放置在几何空间的正单纯形顶点上,实现了所有玩家天然等距且地位平等。这种设计不含任何可学习参数,随机分配坐标,使得模型在无需更改架构的情况下,就能实现“双人数据训练、四人场景直接跑通”的跨越式泛化。数智化转型网www.szhzxw.cn

其次,为了解决算力吞吐瓶颈,Gamma-World 引入了“稀疏枢纽注意力机制(Sparse Hub Attention)”。该设计彻底摒弃了传统的两两直接通信模式,改用一组可学习的枢纽 Token 作为共享世界状态的压缩中转站,将计算成本成功降至线性复杂度。在独立的缓存技术加持下,系统成功实现了每秒24帧(24FPS)的实时动作响应推演。数智化转型网www.szhzxw.cn

在训练层面,项目采用了三阶段师生蒸馏法,利用双向教师模型引导因果学生模型,成功将多步采样压缩为4步采样,不仅保障了动作的可控性,还有效缓解了自回归推演中的误差累积。数智化转型网www.szhzxw.cn

实验数据显示,在多人 Minecraft 虚拟环境的记忆、建造等五类核心场景测试中,Gamma-World 相比现有最强模型取得了全面领先,评估视频质量的 FVD 指标平均降幅超过40%。此外,该框架已成功迁移至真实双臂机器人的协同任务中,充分验证了其跨场景的通用性。这不仅标志着多智能体仿真能力的提升,未来更有望为多臂医疗协同、工厂多机器人调度以及自动驾驶等物理 AI 领域提供全新的大规模模拟生成基础设施。数智化转型网www.szhzxw.cn

若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

思思微信二维码

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

Carina微信二维码

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

底部图片
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/122028.html
0
标签:
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部