万亿参数旗舰模型Ling-1T正式发布并开源
创始人
2025-10-10 12:17:47
0

封面新闻记者 张越熙

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。

据透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

除此之外,Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,百灵团队提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准地对齐。

记者了解到,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。

相关内容

热门资讯

即将开幕!首届WCE世界营地博... 想对话全球营地大佬?想抄浙江标杆营地的实战作业?想一站式对接国际资源与供应链?2025年11月7-9...
韩国游客最喜欢这家上海酒店,不... 打开百度APP畅享高清图片 今天(5日),进博会首日,位于九江路福建中路的上海大酒店离境退税“即...
“文旅+”跨界玩出新花样:追演... 戴上MR眼镜一秒穿越古蜀国——在三星堆博物馆,除了欣赏文物还可以体验考古;在济南看完周杰伦演唱会,凭...
11月北京必去的9个赏秋地,错... 从热闹的公园,到静谧的街角北京,仿佛变成被秋天打翻的调色盘银杏、彩叶、粉黛每一步都像踩在油画里老舍那...
“金秋忻州 山水温泉”2025... 当秋光漫过忻州的群山旷野层林染透黛色清风捎来暖意这场酝酿了一整年的秋日盛景正以最温柔的姿态邀您共赴“...
“史上最长”春节假期来了!机票... “史上最长”春节假期来了!11月4日,国务院办公厅公布了2026年放假安排,其中春节放假安排为2月1...
沙力旅游服务驿站曾是很完美的观... 从泸沽湖前往丽江,中途会经过很多观景平台,它们要么是以村为名,要么是借着附近出众的自然风光和人文景观...
泸沽湖镇的石板路是当地摩梭文化... 哈哈,不知道为什么,想起这条泸沽湖镇上的石板路,我先要表达的其实是“苦笑”!因为除了正常的环湖骑行外...
中国旅游研究院联合马蜂窝发布《... 在中央和地方文旅促消费政策,以及文旅大消费融合不断深化的双重推动下,“在地风物”已成为新的消费热点。...
11月8日,邀请所有记者免票游... 大象新闻记者 池里军 罗雅静将脚下泥土,变为笔尖力量把生活感动,化为人心光亮11月8日,中国记者节银...