深度｜开源新王M2与全模态布局，AI竞赛的另一种可能_日常知识

深度｜开源新王M2与全模态布局，AI竞赛的另一种可能

创始人

2025-10-30 11:16:07

0次

01AI竞赛中的中场战事焦虑？

2025年10月的最后一周，面对市场关于其冲刺“大模型第一股”的传闻，总部位于上海的AI公司MiniMax稀宇极智，选择用一场纯粹的技术发布来回应外界的关注。

其新一代自研开源文本大模型M2，在权威的Artificial Analysis榜单上登顶全球开源模型第一，综合能力在智能体（Agent）和代码（Coding）等关键维度上，逼近了GPT-5等顶尖闭源模型。同时，一个值得注意的细节是，其原创算法CISPO被AI巨头Meta在其最新论文中公开致敬。

这一系列事件，发生在全球AI竞争进入“中场战事”的关键节点。自GPT-4o发布以来，“多模态”与“智能体”已成为行业共识。当用户期待AI从“对话”升级为“执行”，技术愿景的宏大与商业化落地的焦虑形成了鲜明对比。

MiniMax的此次亮相，不仅是技术实力的展示，更是其长期战略的一次集中兑现。它以一种独特的节奏，与海外大厂同周期实现了技术突破，却以一条更聚焦于“成本-效率”的路径，为行业竞争范式带来了新的变量。

02不务正业的AI创业公司？

曾几何时，MiniMax被质疑“大模型自研公司搞多模态是不务正业”，“文本模型没有视频好”、“战线太分散什么都做”；时隔四月，MiniMax用新一轮全模态技术发布，给出了自己的答案——一切回归技术本身。

此次系列发布的重头戏，是新一代开源文本大模型M2。它的实力不仅体现在榜单排名，更体现在扎实的底层能力和来自同行的认可。上线3天，便在知名AI聚合平台OpenRouter就快速攀升到全球调用量第7名与编程场景第3名。

就在M2发布前夕，Meta在其重磅论文中，详细阐述并验证了来自MiniMax的一项原创强化学习算法——CISPO。Meta在其研究中采纳了该算法，并指出其在提升多轮对话逻辑性方面展现了良好的效率和结果。

图源：《The Art of Scaling Reinforcement Learning Compute for LLMs》

这份来自顶尖同行的认可，也让M2在权威评测机构Artificial Analysis (AA)榜单上的表现显得顺理成章：总分冲入全球前五，在所有开源模型中位列第一，综合表现超越Google的Gemini 2.5 Pro和Anthropic的Claude 4.1，直逼Claude 4.5 Sonnet。

而榜单之下，更能体现M2“肌肉”的是其在多个垂直专业基准测试中的统治级表现，这些测试的结果与开发者在终端、IDE和CI/CD中的日常体验高度相关：

首先，M2展现了强大的端到端开发能力，它不仅在处理多代码文件、执行完整的“编码-运行-调试”循环上表现出色，更是在Terminal-Bench和SWE-Bench等高难度基准测试中名列前茅。这标志着它已具备真正深入开发者工作流的实用价值。

伴随M2发布的，是其颠覆性的价格：单位成本不到同级竞品Claude 4.5的8%，并面向全球限时免费，“直到服务器扛不住为止”。这不再是简单的价格战，而是一场旨在瓦解“算力税”、推动AI普惠的战略举措。

03 模仿者 or 开拓者？

在M2吸引了全球目光的同时，MiniMax的多模态模型迅速展开了协同出击，视频、语音不同战线，全力推动AI走向“生产力工具”。新发布的Hailuo 2.3视频模型，并同步推出 Fast 版本，为B端工业级应用降本50%，精准打击了AI视频“叫好不叫座”的商业软肋。同时，革命性的Media Agent交互范式，将AI从“黑盒生成器”变为“创作伙伴”，展示了其对下一代内容创作工作流的深刻思考。

在语音模型上，Speech 2.6模型打通了Voice Agent场景下的高延迟痛点，以250ms首包延迟的极致性能，彻底解决了语音交互的“卡顿感”，并凭借自动文本规整、高鲁棒性复刻等“像素级”打磨，赢得了LiveKit、Pipecat、Vapi等海内外顶级客户的订单。

10月的这一系列密集发布、配合默契，全面展示了MiniMax作为一家全栈自研、多模态公司的体系化实力。就在这个月初，Sora2的发布和快速走红，让全球用户再次看到多模态的席卷之势；而在此之前，上一个出圈的还是Google Veo3模型的音视频融合及OpenAI GPT-4o模型的宫崎骏画风。

可以看到，多模态融合已经成为大模型发展的全球趋势，而MiniMax这场三线并进的预演，清晰地展示了MiniMax的体系化作战能力和务实路径，市场由此意识到，一场更大的战役正在酝酿。

在中美AI竞赛的宏大背景下，通往AGI的路径出现了分野：一种是“大力出奇迹”式的，倾力吞卡上规模全力构建一个大一统的底层模型，理论优雅，但成本高昂且商业化缓慢。

而MiniMax展示的，是另一种“飞轮生态”式的路径。它务实地在文本、视频、语音等各条战线上深耕技术，并将最前沿的模型能力注入自研应用，用已经跑通的商业闭环去反哺、验证模型的迭代方向。它的打法，是在抵达AGI的终局之前，先确保赢得中场战事，用商业上的成功去对冲技术路线的不确定性，步步为营。这种打法，或许正是AI竞赛下半场的一种“中国解法”。至于能否成功，我们拭目以待。

References:

• 《The Art of Scaling Reinforcement Learning Compute for LLMs》 https://arxiv.org/pdf/2510.13786

• https://www.minimax.io/news/minimax-m2

全球竞赛技术 MiniMax 公司布局模型文本 Claude 视频 Meta 模态

上一篇：遭赛季三杀！联赛杯-萨尔双响利物浦轮换阵容0-3水晶宫出局

下一篇：鼎捷数智三季报：用“AI+”改写行业规则

深度｜开源新王M2与全模态布局，AI竞赛的另一种可能

相关内容

热门资讯