阶跃星辰再开源 推出SOTA级端到端语音大模型
创始人
2025-09-01 13:43:27
0

近日,阶跃星辰正式发布最强开源端到端语音大模型Step-Audio 2 mini,该模型在多个国际基准测试集上取得SOTA(State-of-The-Art,即当前最佳水平)成绩。

上证报中国证券网讯(记者 孙小程)近日,阶跃星辰正式发布最强开源端到端语音大模型Step-Audio 2 mini,该模型在多个国际基准测试集上取得SOTA(State-of-The-Art,即当前最佳水平)成绩。

在技术层面,Step-Audio 2 mini采用真正的端到端多模态架构,并将语音理解、音频推理与生成统一建模,不仅时延更低、输出更快,还能更加精准地理解副语言信息、非人声信号等语音要素,显著提升了语音人机交互的效率和智能上限。

根据测评,这款模型在音频理解、语音识别、跨语种翻译、情感与副语言解析等任务中表现突出,综合性能超越Qwen-Omni 、Kimi-Audio在内的所有开源端到端语音模型,并在大部分任务上超越GPT-4o-audio。

在此之前,吉利发布了搭载阶跃星辰端到端语音大模型的吉利银河M9,这是行业内端到端语音大模型首次实现量产上车。

阶跃星辰相关负责人介绍,自去年发布国内首个千亿参数端到端语音大模型Step-1o Audio以来,公司持续迭代模型性能,并跟吉利、鲸鱼机器人、TCL、Cyan青心意创等头部终端厂商达成深度合作,让语音大模型在生活场景中为消费者提供更加智能、便捷的互动体验。

今年以来,阶跃星辰已经开源8款性能领先的多模态模型,覆盖语音、视频生成、图像编辑、3D、多模态推理等多个类别。

相关内容

热门资讯

飞荣达股价跌5.03%,信达澳... 来源:新浪基金∞工作室 1月27日,飞荣达跌5.03%,截至发稿,报33.95元/股,成交3.20亿...
上海世博文化公园新展剧透:藏品... 东方网记者柏可林1月31日报道:今年,上海世博文化公园将迎来一场自然与艺术交织的盛宴。作为上海国际花...
来金汇天街,逛年宵花市! · 年宵花市time:2月2日~2月8日13:00~20:00add:金汇天街1f主中庭300㎡花市...
数小时两度改名:爆火AI助手C... IT之家 1 月 31 日消息,爆火开源 AI 智能体 Clawdbot 在数小时内经历了两次更名,...
央媒看四川丨四川九寨沟:童话秘... 光明日报记者 周洪双 李晓东冬日的九寨,银装素裹,碧水彩林与白雪交相辉映,宛如童话世界。自2025年...
北京也有“北欧同款”冰浮?小心... 来源:北京晚报微信公众号身穿特制的漂浮衣,惬意地在冰河上漂,这是近几年在北欧兴起的冬季特色项目“冰浮...
山东青岛:栈桥赏鸥 本文转自:人民网2026年1月30日,山东青岛栈桥景区,成群的海鸥在空中飞翔盘旋,吸引众多游客前来观...
高促会赵震声:“AI+能源”绝... 来源:中国能源网 2026年1月30日,以“智赋未来·能启新篇”为主题的AI+能源发展大会在中关村会...
鸿讯信盟取得基于AI的多模态气... 国家知识产权局信息显示,北京鸿讯信盟通讯技术有限公司取得一项名为“一种基于AI的多模态气象数据存储方...
魔都赏花新去处,都是典藏级!1... 奇花艺境展高达10米的垂枝梅,树龄千年的油橄榄,杜鹃中的“爱马仕”,上百棵各色植物珍品,19件顶尖艺...