商汤开源新模型SenseNova-MARS,号称让AI真正具备“执行能力”
创始人
2026-01-30 12:18:15
0

IT之家 1 月 30 日消息,1 月 29 日,商汤宣布开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本)。据商汤介绍,该模型是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型。

IT之家附有关地址如下:

  • Github 仓库:https://github.com/OpenSenseNova/SenseNova-MARS

模型仓库:

  • 32B:https://huggingface.co/sensenova/SenseNova-MARS-32B
  • 8B:https://huggingface.co/sensenova/SenseNova-MARS-8B

根据介绍,其在多模态搜索与推理的核心基准测试中以 69.74 分超越 Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。

SenseNova-MARS 是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型,能自己规划步骤、调用工具,轻松搞定各种复杂任务,让 AI 真正具备“执行能力”。

在 MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA 等基准测试中,SenseNova-MARS 取得开源模型中的 SOTA 成绩,还超越 Gemini-3.0-Pro、GPT-5.2 等顶级闭源模型

官方提供了一系列使用案例如下。

面对识别赛车服微小 logo + 查询公司成立年份 + 匹配车手出生年月 + 计算差值的复杂任务,SenseNova-MARS 可自主调用图像裁剪、文本 / 图像搜索工具,无需人工干预完成闭环解答。

SenseNova-MARS 能从产品和行业峰会的照片中,识别企业的标志,快速搜集产品、企业的信息,以及时间、数量、参数等细节要素,辅助分析行业情况和格局。

SenseNova-MARS 能从赛事照片中识别画面中的 logo、人物等信息,追溯比赛或人员背景信息,帮助快速补充重要细节。

SenseNova-MARS 还能够轻松处理超长步骤的多模态推理和超过三种工具调用,自动裁剪分析细节、搜索相关研究数据,快速验证假设,得出关键判断。

SenseNova-MARS 能够自动解决“细节识别 + 信息检索 + 逻辑推理”复杂任务,帮助实现工作效率提升。

  • 图像裁剪:能精准聚焦图片上的微小细节,哪怕是占比不到 5% 的细节 —— 比如赛车手衣服上的微小 logo、赛事照片里观众席的标语,都可通过裁剪放大清晰分析。
  • 图像搜索:能在看到物体、人物或场景的瞬间自动匹配相关信息 —— 比如识别出赛车手的身份,或是某款冷门设备的型号。
  • 文本搜索:能快速抓取精准信息 —— 无论是公司成立年份、人物出生年月,还是最新的行业数据,都能秒级获取。

相关内容

热门资讯

100余项活动火热开启 马年春... 封面新闻记者 刘虎1月30日,四川省遂宁市2026年春节期间系列活动新闻发布会正式召开。从热闹的民俗...
大雪致全国多地景区临时关闭,气... 近日,我国中东部多地出现明显降雪天气。据中央气象台消息,29日06时至30日06时,甘肃、陕西、山西...
北京国际化消费环境持续优化,2... 2026年1月28日,北京市统计局发布数据。2025年全年,全市共接待入境游客548万人次,同比增长...
【直播】春节假期玩转上海!松江... 想解锁年味十足、玩法丰富的新春假期?1月31日中午12点,“旅选上海,超级新春”文旅大直播将迎来第4...
贵州:科技艺术融合点亮“中国溶... 本文转自:人民网-贵州频道织金洞擘画高质量发展新蓝图贵州:科技艺术融合点亮“中国溶洞之王”1月29日...
【AI贵阳】贵小阳的五年升职记 AI贵阳工作室出品 策划/宋德政 制作/宋德政 卢珊 周钰爽 剪辑/曾玉璇
原创 A... 最高级的捕食者,往往只吃热量最高的内脏,而不是把猎物吃干抹净。 作者|杨知潮 如果一家公司赚走行业九...
吴越国已成往事,但钱王祠探梅值... 周五夜晚,友人邀请我品茗闲谈,来到目的地却被友人告知临时有事要爽约。返程经过庆春路口,一缕幽香绕过夜...
京彩迎春 ︳一站式预订乡村游!... 1月30日,北京市人民政府新闻办公室举行2026年北京市春节文化活动新闻发布会。现场,北京市文化和旅...