Connect with us

GPLP

地瓜机器人推出交互式世界模型Uranus,面向机器人训练与评测提供生成式仿真环境

快报道

地瓜机器人推出交互式世界模型Uranus,面向机器人训练与评测提供生成式仿真环境

地瓜机器人算法团队近日推出交互式世界模型Uranus,面向机器人训练、评测和策略模型迭代场景,尝试用数据生成的方式降低机器人仿真环境的搭建成本。

机器人开发离不开大量测试与验证。真机测试成本高、周期长,环境变量难以完全控制;传统仿真器虽然可以提升验证效率,但在实际使用中仍依赖场景建模、材质设定和物理参数调校等流程。随着机器人策略模型、VLA和世界模型持续迭代,行业对可交互、可复现仿真环境的需求正在增加。

Uranus基于视频扩散模型,采用帧级闭环模式。给定参考图像、机器人关节状态、相机参数和文本描述,模型可以自回归地生成多相机视角下连续、可控的未来视频流,用于模拟机器人与环境的交互过程。

帧级闭环是Uranus的核心机制。传统开环生成通常是输入一段动作后一次性输出整段视频;Uranus每一步只生成下一帧,并将生成结果反馈给下一步预测。由于生成过程按帧推进,动作指令可以在过程中实时调整,模型会根据新的动作继续生成后续画面。这让Uranus更接近机器人训练和评测所需要的交互式仿真环境。

在跨具身泛化方面,Uranus通过统一的骨架渲染管线,将不同机器人本体的动作映射到同一种“图像语言”中。系统可以根据机器人描述文件和关节状态,自动生成统一格式的骨架图。同一模型可支持 G1 人形机器人、Franka协作臂、双臂系统以及移动平台等不同具身形态。

Uranus还支持分钟级闭环稳定生成、多视角空间一致和相机轨迹控制。在训练只使用2秒短片段的情况下,模型可以在推理阶段稳定生成60秒级别的闭环视频;同时支持3路以上相机视角同步生成,并允许开发者在闭环过程中调整相机位置和角度。

从应用场景看,Uranus可用于模型评测、训练数据生成和强化学习支持。在模型评测中,可以根据策略输出的动作逐帧生成环境反馈,并记录成功率、轨迹偏差等指标;在训练场景中,可以形成“动作—反馈—再动作”的闭环过程,为策略模型训练、调试和验证提供支持。

Uranus建立在预训练的Wan2.1视频DiT骨干之上,提供1.3B和14B两个参数规模,分别适用于快速实验和高保真闭环生成场景。后续,地瓜机器人将公布完整技术报告、训练细节和定量实验结果。

更多关于 快报道的文章

To Top