阿里巴巴重磅发布 Qwen-Robot 具身智能大模型系列,开启机器人AI新纪元

据 IT 之家报道,阿里巴巴近日发布千问具身智能大模型 Qwen-Robot 系列。该系列包含三大模型:面向操作任务的 VLA 模型 Qwen-RobotManip、面向移动任务的 VLN 模型 Qwen-RobotNav,以及面向环境动态预测的世界模型 Qwen-RobotWorld。三者分别赋予机器人灵巧的操作能力、自主移动能力和基于物理规律进行推演的“思考”能力,既支持独立部署,也可协同运行。

其中,Qwen-RobotNav 通过可控观测编码和工具接口,将视觉语言能力接入移动控制,统一覆盖指令跟随、点导航、目标导航、目标追踪以及自动驾驶四类任务。Qwen-RobotManip 则通过规范状态—动作空间,并基于相机坐标系下的末端执行器增量位姿,将视觉语言能力接入机器人操作控制。该模型基于完全由开源数据构建的超过 38,100 小时语料库,实现了大规模、多机型训练。

Qwen-RobotWorld 通过自然语言动作接口,将视觉语言能力接入世界动态预测,使同一世界模型能够跨操作、驾驶和导航等场景,预测符合物理规律的未来状态。

Facebook
Twitter
LinkedIn
Telegram

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注