最先进AI工具生成声音与人声无异
创始人
2025-09-29 10:44:45
0

许多人仍认为人工智能(AI)生成的语音听起来“机械感”明显,但英国伦敦玛丽女王大学研究团队在新出版的《公共科学图书馆·综合》杂志上发表论文指出,AI语音合成技术已进入新阶段,其生成的“克隆语音”或深度伪造声音,逼真度与真人录音无异。

研究团队采用当前最先进的AI语音合成工具,生成两类合成语音:一类是基于真人录音的“克隆”声音,旨在模仿特定说话者;另一类则由大型语音模型生成,不针对具体个人。参与者被要求辨别声音的真实性与可信度。

尽管研究未发现AI声音存在“超真实效应”(即比真人更像真人),但结果显示,“克隆语音”的逼真度已与真人声音不相上下,令人难以分辨。且部分AI生成的声音在可信度评价中甚至超越了真人录音。

研究团队表示,AI语音已渗透日常生活,如Alexa、Siri及各类客服系统。虽然当前系统音色仍具机械特征,但自然度接近人声的AI语音技术已然成熟。利用商用软件仅需几分钟真人录音,即可快速、低成本地生成高质量声音克隆,且几乎无需专业知识。

最新研究显示,公众对高仿真语音认知机制的研究迫在眉睫。AI语音技术的飞速发展有望给教育、人机交互等领域带来创新机遇——在这些领域,定制的高质量合成语音可增强用户体验。但是,合成语音也对伦理、版权和安全构成挑战,尤其在虚假信息、诈骗与身份冒用等方面需加强防范。

相关内容

热门资讯

蒙童守夜、龟蒙观日,记者见证近... 齐鲁晚报·齐鲁壹点记者 乔显佳2026年元旦期间,临沂蒙童胜境度假区、沂蒙山龟蒙景区联手组织“202...
壁仞科技港股上市首日开盘涨超1... 图片来自壁仞科技官网 1月2日,“港股GPU第一股”壁仞科技挂牌交易,成为2026年A股、港股首家上...
光影之旅,渝见美好!2026“... 夜幕降临,两江交汇处的重庆大剧院广场灯光璀璨。2026年1月1日晚,长安启源·2026“重庆之夜”国...
开源证券:2026年前后更可能... 开源 证券研报称,2025年开启的“资产重估”牛市的空间与节奏:空间上,证券化率为判断指数牛/估值牛...
宝山系列短视频重磅上线,邀你探... 为全方位展现宝山滨江的独特风采,助力旅超大赛热度升温,一组以“风”为核心线索的“风起宝山”系列短视频...
原创 中... 当全球AI巨头为算力疯狂“烧钱”时,这家中国公司生产的、速度比眨眼快千万倍的光模块,成了比电更不可或...
柏瑞安取得基于AI视觉的算力卡... 国家知识产权局信息显示,北京柏瑞安电子技术有限公司取得一项名为“基于AI视觉的算力卡焊接质量实时检测...
智慧互通取得多目标优化AI交通... 国家知识产权局信息显示,智慧互通科技股份有限公司取得一项名为“多目标优化AI交通信号控制方法及系统”...
峨眉山:全山寺院永久免费开放 新京报讯 据峨眉山佛教网消息,为配合政府“建成峨眉山世界级旅游景区、争创全国百强县”的总体目标,感恩...
南京高淳:非遗与潮流撞个满怀,... 当非遗的鼓点撞上摇滚的节奏,当高淳108节板龙辉映无人机的矩阵,当万发烟花在跨年夜空引爆最绚烂的华彩...