DeepSeek-V3.2-Exp模型正式发布并开源 API大幅度降价
创始人
2025-09-30 13:16:59
0

【环球网科技综合报道】9月29日,据DeepSeek官方消息,DeepSeek-V3.2-Exp大语言模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升推理效率,为长序列文本处理提供了更优解决方案。

据官方介绍,DeepSeek-V3.2-Exp 模型是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

具体来说,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。据官方称,在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。(青山)

相关内容

热门资讯

中国雪乡16米大雪人亮相 冰雪... 本文转自:人民网-黑龙江频道人民网牡丹江1月2日电 (记者苏靖刚、尚城)1月1日,中国雪乡景区备受瞩...
新春灯会游人旺 原标题:新春灯会游人旺1月1日晚,合肥市古逍遥津,2026庐州新春灯会璀璨亮灯,吸引众多游客参观游玩...
场面火爆!又一列特色旅游列车从... 1月1日12时12分北京站进站大厅里“把周末交给津旅时光号”的标语下旅客纷纷驻足拍照今天,“津旅时光...
万花迎新启新程,浦江漫游解锁水... 2026年1月1日,久事旅游旗下浦江游览集团与西岸梦中心携手打造的“万花迎新·滨江漫游专线”限时首发...
在深圳,AI技术“照亮”医疗现... 北大深圳医院医学影像科智慧医院应用场景。(北大深圳医院提供) 深圳商报记者 赵鸿飞 一人住院,不必担...
【金猿产品展】景联文Solar... 景联文产品 该大数据类产品由景联文投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025中...
新疆、陕西、甘肃三省(区)党委... 编辑 | 高语阳 近日,央视推出聚焦新时代西部大开发和区域协调发展的大型纪录片——《大西北》,展示...
中外游客相聚“尔滨”体验冰雪跨...   2025年12月31日,哈尔滨冰雪大世界迎来一场欢乐的跨年狂欢,10万余名游客齐聚园区,共同迎接...
中牟“幻乐之城”慢时光·音乐季... 大象新闻记者 池里军 刘少利 通讯员 张晨 段剑锋 实习生 刘般通12月31日夜,当厚重文明的悠远回...
“AI+核技术”上新 海南自贸... 自12月18日海南自由贸易港启动全岛封关运作以来,近半个月来,海南自由贸易港跨境人流量和物流量大幅增...