欢迎来稿
当前位置首页 > 科技新闻 > 正文

智能语音厉害了 “弦外之音”能秒懂

2016-12-02 08:25 来源:新华每日电讯

  人工智能日益“火热”,可目前的智能语音技术,机器还不能充分理解自然语言,听懂“弦外之音”的情景仅存在于科幻作品中。但这正在起变化!

  国内最新的智能语音技术成果表明:机器已能以较高的准确率实现语音转化文字、多语种同步翻译、甚至模仿某个人的声线讲话,以假乱真。

  在上千人的会场,多位嘉宾近3小时的演讲交流,全程无速记员,演讲内容却能实时转成文字显示在大屏幕上。

  新华社记者近日在科大讯飞年度发布会上看到,除了演讲中个别人名地名的差错,以及说话者口语表达中冗余的词汇外,绝大部分演讲内容都被整理得非常准确,并能同步翻译成英、日、韩等多种语言。

  在智能车载系统的展示中,面对驾驶员任性地打断、随意地插话,车载系统竟能通过上下文语境“秒懂”驾驶员意图,甚至对故意“刁难”的极简指令,也能迅速听懂“弦外之音”,导航、听歌、团票都不在话下。

  据介绍,这些都是基于深度神经网络的语音识别技术来实现的。语音识别技术,简单说就是让计算机“听懂”人类的语音,将语音中包含的文字信息提取出来。该项技术在智能计算机系统中扮演着重要角色,相当于给计算机装上了“耳朵”,使其实现人机通信和交互。目前语音识别准确率可达到97%。

  “随着万物互联时代到来,以语音为主、键盘触摸为辅的人机交互正逐渐成为刚需。未来5到10年,人工智能会像水和电一样成为我们生活的必需品,深刻改变我们的世界。”科大讯飞董事长刘庆峰说。

  聪明的机器人要能听会说,语音合成技术就是“让机器像人一样开口说话”,它是涉及声学、语言学、数字信号处理、计算机科学等多个学科的一项信息处理的前沿技术。

  中国工程院院士、中国人工智能学会理事长李德毅表示,在人工智能领域,对话是目前最直接、最便捷的交互方式,对话智能是几乎所有服务机器人的必备技能。

  目前,中国在智能语音技术上已经实现了5到8米的远场识别、多轮交互对话、免唤醒词交流、交流随时打断等多项突破,人机交互越来越流畅自然。

  “不仅中文语音合成技术取得突破,在今年的全球语音合成大赛中,科大讯飞的语音合成技术能够声情并茂讲英文故事,在多种语言的测试中表现不俗。”刘庆峰说。

  让机器人“开口”说话的技术并不新鲜,电子万年历、计算器上都能用得到,但要像人一样说得自然流利、有声调起伏,并非易事。

  记者在现场用手机试用科大讯飞开发的语音合成软件,发现语音合成功能不仅能将文字信息转化为可听的声音信息,还能将某个人的声线特征收入语音库中,然后用很短的时间将文本用被模仿者的声线特点读出来,确有以假乱真之效。未来,人们的声音也可能存在被“盗”用的风险。(记者白国龙)新华社北京电

(责任编辑:王蔚)

热点推荐

人类为什么拥有非凡认知

人类为什么拥有非凡认知

与其它物种相比,人类拥有非凡的认知能力。那么,...

虚拟故宫走红网络 《我的世界》正让年轻人用想象与创造重塑传统文化

虚拟故宫走红网络 《我的世界》正让年轻人用想象与创造重塑传统文化

如今,电子游戏已经从各个层面影响到了人们的生活...

人工智能继续进阶

人工智能继续进阶

在人工智能(AI)领域,“阿法狗”(AlphaGo)是个...

幻日奇观 黑龙江现“三个太阳”

幻日奇观 黑龙江现“三个太阳”

 近日,黑龙江省黑河市逊克县的天空中出现了奇异...

科学家发现 5.3亿年前古老眼睛

科学家发现 5.3亿年前古老眼睛

据国外媒体报道,科学家在一枚距今约5.3亿年的化石...

胡蜂“吹泡泡” 只为蜂巢不潮湿变垮

胡蜂“吹泡泡” 只为蜂巢不潮湿变垮

近日,一张胡蜂吸吮水珠,并用前足保持平衡的图片...

你做过清醒梦吗

你做过清醒梦吗

近日,在《梦境》期刊上发表的一项新研究中,科学...