继“三连发”后 蚂蚁灵波开源具身世界模型LingBot-VA
创始人
2026-01-30 14:48:54
0

1月30日,继空间感知模型、具身大模型与世界模型“三连发”后,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。LingBot-VA首次提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列,使机器人能够像人一样“边推演、边行动”。

在真机评测中,LingBot-VA展现出对复杂物理交互的强适应能力。面对长时序任务(制作早餐、拾取螺丝)、高精度任务(插入试管、拆快递)以及柔性与关节物体操控(叠衣物、叠裤子)这三大类六项高难度挑战,仅需30—50条真机演示数据即可完成适配,且任务成功率相较业界强基线Pi0.5平均提升20%。

在仿真评测中,LingBot-VA在高难度双臂协同操作基准RoboTwin2.0上首次将成功率提升至超过90%,在长时序终身学习基准LIBERO上达到98.5%平均成功率,均刷新了行业纪录。

据悉,LingBot-VA采用Mixture-of-Transformers(MoT)架构,让视频处理与动作控制实现跨模态融合。通过独特的闭环推演机制,模型在每一步生成时都会纳入真实世界的实时反馈,确保持续生成的画面与动作不偏离物理现实,从而控制机器人完成高难度复杂任务。

为突破大规模视频世界模型在机器人端侧落地的计算瓶颈,LingBot-VA设计了异步推理管线,将动作预测与电机执行并行化处理;同时引入基于记忆缓存的持久化机制与噪声历史增强策略,让推理时只需更少生成步骤即可输出稳定、精确的动作指令。这一系列优化使得LingBot-VA既拥有大模型的理解深度,又具备真机低延迟控制的响应速度。

蚂蚁灵波表示,承接前几日开源发布的LingBot-World(模拟环境)、LingBot-VLA(智能基座)与LingBot-Depth(空间感知),LingBot-VA探索出一条“世界模型赋能具身操作”的全新路径。蚂蚁集团将持续依托InclusionAI社区开源开放,与行业共建具身智能基础能力,加速构建深度融合开源开放且服务于真实产业场景的AGI生态。

目前,LingBot-VA的模型权重、推理代码已全面开源。

相关内容

热门资讯

100余项活动火热开启 马年春... 封面新闻记者 刘虎1月30日,四川省遂宁市2026年春节期间系列活动新闻发布会正式召开。从热闹的民俗...
大雪致全国多地景区临时关闭,气... 近日,我国中东部多地出现明显降雪天气。据中央气象台消息,29日06时至30日06时,甘肃、陕西、山西...
北京国际化消费环境持续优化,2... 2026年1月28日,北京市统计局发布数据。2025年全年,全市共接待入境游客548万人次,同比增长...
【直播】春节假期玩转上海!松江... 想解锁年味十足、玩法丰富的新春假期?1月31日中午12点,“旅选上海,超级新春”文旅大直播将迎来第4...
贵州:科技艺术融合点亮“中国溶... 本文转自:人民网-贵州频道织金洞擘画高质量发展新蓝图贵州:科技艺术融合点亮“中国溶洞之王”1月29日...
【AI贵阳】贵小阳的五年升职记 AI贵阳工作室出品 策划/宋德政 制作/宋德政 卢珊 周钰爽 剪辑/曾玉璇
原创 A... 最高级的捕食者,往往只吃热量最高的内脏,而不是把猎物吃干抹净。 作者|杨知潮 如果一家公司赚走行业九...
吴越国已成往事,但钱王祠探梅值... 周五夜晚,友人邀请我品茗闲谈,来到目的地却被友人告知临时有事要爽约。返程经过庆春路口,一缕幽香绕过夜...
京彩迎春 ︳一站式预订乡村游!... 1月30日,北京市人民政府新闻办公室举行2026年北京市春节文化活动新闻发布会。现场,北京市文化和旅...