深度|开源新王M2与全模态布局,AI竞赛的另一种可能
创始人
2025-10-30 11:16:07
0

01AI竞赛中的中场战事焦虑?

2025年10月的最后一周,面对市场关于其冲刺“大模型第一股”的传闻,总部位于上海的AI公司MiniMax稀宇极智,选择用一场纯粹的技术发布来回应外界的关注。

其新一代自研开源文本大模型M2,在权威的Artificial Analysis榜单上登顶全球开源模型第一,综合能力在智能体(Agent)和代码(Coding)等关键维度上,逼近了GPT-5等顶尖闭源模型。同时,一个值得注意的细节是,其原创算法CISPO被AI巨头Meta在其最新论文中公开致敬。

这一系列事件,发生在全球AI竞争进入“中场战事”的关键节点。自GPT-4o发布以来,“多模态”与“智能体”已成为行业共识。当用户期待AI从“对话”升级为“执行”,技术愿景的宏大与商业化落地的焦虑形成了鲜明对比。

MiniMax的此次亮相,不仅是技术实力的展示,更是其长期战略的一次集中兑现。它以一种独特的节奏,与海外大厂同周期实现了技术突破,却以一条更聚焦于“成本-效率”的路径,为行业竞争范式带来了新的变量。

02不务正业的AI创业公司?

曾几何时,MiniMax被质疑“大模型自研公司搞多模态是不务正业”,“文本模型没有视频好”、“战线太分散什么都做”;时隔四月,MiniMax用新一轮全模态技术发布,给出了自己的答案——一切回归技术本身。

此次系列发布的重头戏,是新一代开源文本大模型M2。它的实力不仅体现在榜单排名,更体现在扎实的底层能力和来自同行的认可。上线3天,便在知名AI聚合平台OpenRouter就快速攀升到全球调用量第7名与编程场景第3名。

就在M2发布前夕,Meta在其重磅论文中,详细阐述并验证了来自MiniMax的一项原创强化学习算法——CISPOMeta在其研究中采纳了该算法,并指出其在提升多轮对话逻辑性方面展现了良好的效率和结果。

图源:《The Art of Scaling Reinforcement Learning Compute for LLMs

这份来自顶尖同行的认可,也让M2在权威评测机构Artificial Analysis (AA)榜单上的表现显得顺理成章:总分冲入全球前五,在所有开源模型中位列第一,综合表现超越GoogleGemini 2.5 ProAnthropicClaude 4.1,直逼Claude 4.5 Sonnet

而榜单之下,更能体现M2“肌肉”的是其在多个垂直专业基准测试中的统治级表现,这些测试的结果与开发者在终端、IDE和CI/CD中的日常体验高度相关:

首先,M2展现了强大的端到端开发能力,它不仅在处理多代码文件、执行完整的“编码-运行-调试”循环上表现出色,更是在Terminal-Bench和SWE-Bench等高难度基准测试中名列前茅。这标志着它已具备真正深入开发者工作流的实用价值。

伴随M2发布的,是其颠覆性的价格:单位成本不到同级竞品Claude 4.5的8%,并面向全球限时免费,“直到服务器扛不住为止”。这不再是简单的价格战,而是一场旨在瓦解“算力税”、推动AI普惠的战略举措。

03 模仿者 or 开拓者?

在M2吸引了全球目光的同时,MiniMax的多模态模型迅速展开了协同出击,视频、语音不同战线,全力推动AI走向“生产力工具”。新发布的Hailuo 2.3视频模型,并同步推出 Fast 版本,为B端工业级应用降本50%,精准打击了AI视频“叫好不叫座”的商业软肋。同时,革命性的Media Agent交互范式,将AI从“黑盒生成器”变为“创作伙伴”,展示了其对下一代内容创作工作流的深刻思考。

在语音模型上,Speech 2.6模型打通了Voice Agent场景下的高延迟痛点,以250ms首包延迟的极致性能,彻底解决了语音交互的“卡顿感”,并凭借自动文本规整、高鲁棒性复刻等“像素级”打磨,赢得了LiveKit、Pipecat、Vapi等海内外顶级客户的订单。

10月的这一系列密集发布、配合默契,全面展示了MiniMax作为一家全栈自研、多模态公司的体系化实力。就在这个月初,Sora2的发布和快速走红,让全球用户再次看到多模态的席卷之势;而在此之前,上一个出圈的还是Google Veo3模型的音视频融合及OpenAI GPT-4o模型的宫崎骏画风。

可以看到,多模态融合已经成为大模型发展的全球趋势,而MiniMax这场三线并进的预演,清晰地展示了MiniMax的体系化作战能力和务实路径,市场由此意识到,一场更大的战役正在酝酿。

在中美AI竞赛的宏大背景下,通往AGI的路径出现了分野:一种是“大力出奇迹”式的,倾力吞卡上规模全力构建一个大一统的底层模型,理论优雅,但成本高昂且商业化缓慢。

而MiniMax展示的,是另一种“飞轮生态”式的路径。它务实地在文本、视频、语音等各条战线上深耕技术,并将最前沿的模型能力注入自研应用,用已经跑通的商业闭环去反哺、验证模型的迭代方向。它的打法,是在抵达AGI的终局之前,先确保赢得中场战事,用商业上的成功去对冲技术路线的不确定性,步步为营。这种打法,或许正是AI竞赛下半场的一种“中国解法”。至于能否成功,我们拭目以待。

References:

The Art of Scaling Reinforcement Learning Compute for LLMshttps://arxiv.org/pdf/2510.13786

https://www.minimax.io/news/minimax-m2

相关内容

热门资讯

肥东县把“村咖”开进风景里 肥... 本文转自:人民网-安徽频道当合肥近郊第一高峰浮槎山的云雾尚未散尽,“山与山时”咖啡馆的落地窗已映出静...
2025“你好,北京”中轴雅韵... 2025年10月30日,由北京市文化和旅游局主办、北京市海外文化交流中心承办的2025“你好,北京”...
全国首个熊猫主题3.0版景区式... 封面新闻记者 秦怡10月31日,成都百联奥特莱斯广场项目开工活动在成都熊猫国际旅游度假区隆重举行,标...
枣庄市市中区:秋意缱绻 邂逅一... 齐鲁网·闪电新闻10月31日讯 枣庄市市中区东湖公园内,秋意正浓树叶渐黄,清晨的阳光洒在湖面上泛起...
开源证券:风电政策底已现 开源证券指出,收入端政策不确定性落地,市场化改革进入深水区,风电政策底已现。136号文推动新能源全面...
重庆云阳:高峡出平湖 风景美如... 随着长江云阳段新一轮蓄水水位达到175米,重庆市云阳县进入“看海”模式。景城一体、山环水绕的云阳县城...
原创 京... △「2025年的双11电商大战,更像是电商 AI Agent的一场激烈角逐。」 文 | 李秉浩 一年...
宁夏计划为560台“高龄”电梯... 10月30日,记者从宁夏回族自治区市场监督管理厅获悉,面对使用年限超过15年的电梯日益凸显的安全风险...
中兴通讯呈现AI家庭“四大件”... 10月30日,中兴通讯(000063)举办“AI家庭体验日”,集中呈现其AI家庭“四大件”的落地成果...
华为哈勃入股AI公司模思智能 企查查APP显示,近日,上海模思智能科技有限公司发生工商变更,新增深圳哈勃科技投资合伙企业(有限合伙...