24小时AI直播不怕“嘴型对不上” 国产超低延时数字人模型开源迈入商用阶段丨预见·科技
创始人
2026-02-03 12:49:09
0

封面新闻记者 欧阳宏宇

记者2月3日获悉,近期一项由中国AI团队研发的实时数字人生成模型已完成开源。据介绍,该模型名为SoulX-FlashTalk,是首个能够实现0.87s亚秒级超低延时、32fps高帧率,并支持超长视频稳定生成的14B数字人模型。

在行业中,传统数字人生成方案大多面临画面生成时间长、延迟高、生成效果差、效果不稳定、保真度低等问题。

对此,据研究团队Soul App AI团队(Soul AI Lab)介绍,SoulX-FlashTalk在研发过程中,通过延迟感知时空适配,和自研的自纠正“双向蒸馏”两项技术,解决了生成中可能出现的人物面部不一致或显著画质下降等问题。在短视频评测中,实现了3.51的ASE和4.79的IQA刷新了视觉保真度记录,在长短视频任务中也维持了32FPS的高吞吐量。

该团队还表示,接下来,会聚焦语音对话合成、视觉交互等核心交互能力的提升,以持续推进开源工作为契机,为推动“ AI +社交”方向前沿能力建设贡献力量。

谈及应用前景,分析称,该模型开源后将有机会在多领域、行业实际落地,创造更多价值。例如,在电商领域打造7×24小时AI直播间,解决数字人直播长时间运行后常会出现的嘴型对不上或画质模糊的问题。

此外,在短视频制作、AI教育、多元互动场景NPC交互、AI客服等方向,模型也提供了高质量、可落地、可接入业务系统的解决方案。

业内人士表示,此次开源新模型,除了在速度、效果、延迟和保真度上表现出色,更重要的是,为行业提供了切实可应用的业务解决方案,推动大参数量实时生成式数字人迈入可具体商用落地阶段。

相关内容

热门资讯

新春走基层|探访残疾人“AI就... 腊月以来,甘肃省兰州市心连心社会工作服务中心一片忙碌。这里面积不大,却很温暖,十几名员工安静地坐在电...
春节AI牌局,阿里跟注30亿 互联网习惯了用短期让利换取用户行为迁移的打法,AI也染上了相似的毛病。 2月2日,阿里巴巴旗下千问A...
当AI爱人被判“死刑” 文 | 新京报记者 刘思维 实习生 尹诗琪 真正的“死亡通知书”,迟到了整整20个月。 2026年...
“AI治理”入选十大科技热词,... 1月29日,中国科技新闻学会发布2025年度“十大科技热词”,“AI治理”入选。 当前,AI治理已上...
广东肇庆岩前村,好山好水好休闲... 陶永奎 摄广东肇庆岩前村,好山好水好休闲广东肇庆岩前村,好山好水好休闲广东肇庆岩前村,好山好水好休闲...
外国人春节来沪热度攀升 上海百... 2月3日,一场精彩的昆剧《牡丹亭·惊梦》选段表演在上海总商会旧址内上演,也拉开了“沪上迎春,融情送福...
新春游广西!超千场春节促消费活... 1月30日,“购在中国——2026广西乐购新春消费季”活动新闻发布会在南宁举行。据发布会介绍,马年春...
从工业小岛到二次元胜地,复兴岛... 去年,复兴岛从原本低调的工业小岛,一夜之间变身二次元“痛岛”,吸引众多年轻人争相打卡。迈入“十五五”...
河南航文旅提升座谈会:把航空交... 一条航线如何与河南各城市紧密相连?航空与旅游该如何提升发展?如何把河南悠久的文化资源作出市场叫好、旅...
开源物联网健康监测系统:赋能偏... 文章导读 COVID-19大流行对全球医疗体系造成了深远影响,尤其暴露了发展中国家在资源分配和技术...