研究:人工智能生成语音可以假乱真

2025-10-09 06:39 来源:参考消息网
查看余下全文
(审核:欧云海)
光影之间
光影之间
记者专栏

首页 > 推荐阅读 > 正文

研究:人工智能生成语音可以假乱真

2025年10月09日 06:39   来源:参考消息网   

参考消息网报道 据美国趣味科学网站10月4日报道,科学家表示,普通听众已无法分辨真人声音与“深度伪造”语音的区别。

美国《科学公共图书馆·综合》杂志9月24日发表的一项新研究结果表明,当同时聆听真人声音与AI生成的相同语音,人们无法准确区分真人声音与伪造语音。

研究报告的主要作者、伦敦玛丽王后大学心理学高级讲师娜丁·拉文在一份声明中称:“如今AI生成语音已无处不在。我们都和Alexa或Siri交谈过,我们的电话由自动客服系统接听。这些语音听起来还不太像真人声音,但AI技术生成自然的、像人声的语音只是时间问题。”

研究表明,虽然从零开始生成的通用语音被认为不够逼真,但基于真人声音训练出来的克隆语音,即深度伪造声音,其可信度与真人声音完全相当。

研究人员给受试者提供了80种不同的语音样本(40种为AI生成语音,40种为真人声音),让他们找出哪些是真人声音、哪些是AI生成语音。结果显示,平均仅有41%的从零生成的AI语音被误判为真人声音。这表明,在大多数情况下,人们仍能将AI语音与真人声音区分开。

然而,对于依照真人声音克隆出来的AI语音,有58%被误判为真人声音。而真人声音被正确识别出来的比例也仅略高一点(62%)。研究人员由此得出结论:在辨别真人声音与深度伪造的克隆语音方面,我们的能力不存在统计学意义上的差异。

拉文表示,这一结果可能对伦理、版权和安全领域产生深远影响。若犯罪分子利用AI克隆你的声音,他们将能更容易绕过银行的语音验证程序,或欺骗你的亲友转钱。

类似事件其实已发生多起。例如,7月9日,佛罗里达居民莎伦·布赖特韦尔被骗走1.5万美元。她认为她在电话中听到自己的女儿哭诉称出了车祸,需要钱聘请律师以免入狱。谈到那段逼真的AI伪造语音,布赖特韦尔表示:“没人能说服我,那不是她的声音。”

逼真的AI语音还可能被用于伪造政治人物或名人的声明和访谈。伪造的声音可能被用来诋毁个人或煽动动乱,进而埋下社会分裂与冲突的隐患。例如,近日有骗子利用AI克隆澳大利亚昆士兰州州长史蒂文·迈尔斯的声音,并借用他的公众形象试图诱使人们投资一个比特币骗局。

研究人员强调,他们在研究中使用的克隆语音其实并非特别复杂。这些克隆语音是他们使用商用软件生成的,仅用4分钟的人类声音录音对其进行了训练。

拉文在声明中说:“整个过程所需的专业知识极少,只需要几分钟的语音录音,成本也几乎为零。这恰恰表明,AI语音技术已变得多么容易获取,且多么先进。”(编译/刘宗亚)


(审核:欧云海)

推荐阅读

血凝胶纤维机器人:脑内的药物“速递达人”

大脑颅内肿瘤,尤其是位于脑深部或者临近重要功能脑区的肿瘤,一直是临床治疗中的重要挑战。为验证血凝胶纤维机器人在颅内肿瘤靶向治疗中的可行性与疗效,研究人员在18头小型猪中构建了脑胶质瘤模型,并将其分为三组:空白对照组、假手术组和治疗组。未来,团队将进一步聚焦于血凝胶纤维机器人的结构优化、运动控制精度... [详细]

钙钛矿有机电池光电转换效率纪录刷新

新加坡国立大学科研团队研制出一款新型钙钛矿有机串联太阳能电池,经权威认证,其1平方厘米有效面积内的光电转换效率达到26.4%,创下同类设备的世界纪录。在具体实施中,研究团队先将这种高性能有机子电池与顶层的钙钛矿电池叠加,再通过透明导电氧化物互连层将二者有机结合。这一成果不仅刷新了钙钛矿有机电池的纪录,... [详细]

低温下精准控制量子比特的芯片问世

量子计算机要真正实现大规模实用化,关键在于如何稳定、精准地控制海量量子比特。研究团队研制出一种可在毫开尔文温度条件下控制自旋量子比特的硅芯片。实验结果表明,只要控制系统设计得当,即使量子比特与不到一毫米远的晶体管芯片共存,其量子态几乎不会受到干扰。研究人员认为,该低温电子平台不仅可助力量子计算,... [详细]