万亿参数旗舰模型Ling-1T正式发布并开源
创始人
2025-10-10 12:17:47
0

封面新闻记者 张越熙

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。

据透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

除此之外,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,百灵团队提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准地对齐。

记者了解到,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。

相关内容

热门资讯

春日赏花季!湖南会同万亩油菜花... 来源:中国新闻网图为坐落在万亩油菜花田内的稻梦小镇。付俊华 摄3月4日,湖南怀化市会同县堡子镇万亩油...
具身智能重塑沉浸式文旅体验 来源:光明日报张宜春(中国艺术科技研究所数字艺术部主任)随着大模型技术飞速发展,具身智能“感知—决策...
让AI成为创新人才培养“加速器... 着力培养孩子着眼未来的意识和能力,帮助他们更好地适应智能社会 今年全国两会期间,人工智能成为代表委员...
新春游:热潮涌动 意蕴悠悠 来源:光明日报作者:本报记者 鲁元珍《光明日报》(2026年03月05日 14版)【文旅观察】旅游过...
博通 AVGO:AI 火力全开... 博通 (AVGO.O) 北京时间 2026 年 3 月 5 日凌晨,美股盘后发布 2026 财年第一...
港股AI应用股走强 MINIM... 截至发稿,MINIMAX-WP(00100.HK)涨7.76%、汇量科技(01860.HK)涨5.9...
性价比高的AI搜索优化怎么做,... 性价比高的 AI 搜索优化怎么做,GEO AI 推广团队解读 一、引言 在数字化时代,AI 搜索已...
“AI制药独角兽”再获融资,A... 当前,AI正在加速融入到千行百业之中,不断地给它们带来新的活力。仔细梳理,不难发现,但凡是那些实现了...
AI成为面试官后,大部分的岗位... 文 | 温度纪,作者|肆夕,编辑|路子甲 邱佳默背了一整天自我介绍后,对着镜子整理好衬衫领口,终于...
高盛CEO苏德巍:在人工智能(... 高盛CEO苏德巍:在人工智能(AI)前景方面,我们“看到杯子装了一半”。