编码中心
欢迎来稿
当前位置首页 > 科技新闻 > 正文

智能语音厉害了 “弦外之音”能秒懂

2016-12-02 08:25 来源:新华每日电讯

  人工智能日益“火热”,可目前的智能语音技术,机器还不能充分理解自然语言,听懂“弦外之音”的情景仅存在于科幻作品中。但这正在起变化!

  国内最新的智能语音技术成果表明:机器已能以较高的准确率实现语音转化文字、多语种同步翻译、甚至模仿某个人的声线讲话,以假乱真。

  在上千人的会场,多位嘉宾近3小时的演讲交流,全程无速记员,演讲内容却能实时转成文字显示在大屏幕上。

  新华社记者近日在科大讯飞年度发布会上看到,除了演讲中个别人名地名的差错,以及说话者口语表达中冗余的词汇外,绝大部分演讲内容都被整理得非常准确,并能同步翻译成英、日、韩等多种语言。

  在智能车载系统的展示中,面对驾驶员任性地打断、随意地插话,车载系统竟能通过上下文语境“秒懂”驾驶员意图,甚至对故意“刁难”的极简指令,也能迅速听懂“弦外之音”,导航、听歌、团票都不在话下。

  据介绍,这些都是基于深度神经网络的语音识别技术来实现的。语音识别技术,简单说就是让计算机“听懂”人类的语音,将语音中包含的文字信息提取出来。该项技术在智能计算机系统中扮演着重要角色,相当于给计算机装上了“耳朵”,使其实现人机通信和交互。目前语音识别准确率可达到97%。

  “随着万物互联时代到来,以语音为主、键盘触摸为辅的人机交互正逐渐成为刚需。未来5到10年,人工智能会像水和电一样成为我们生活的必需品,深刻改变我们的世界。”科大讯飞董事长刘庆峰说。

  聪明的机器人要能听会说,语音合成技术就是“让机器像人一样开口说话”,它是涉及声学、语言学、数字信号处理、计算机科学等多个学科的一项信息处理的前沿技术。

  中国工程院院士、中国人工智能学会理事长李德毅表示,在人工智能领域,对话是目前最直接、最便捷的交互方式,对话智能是几乎所有服务机器人的必备技能。

  目前,中国在智能语音技术上已经实现了5到8米的远场识别、多轮交互对话、免唤醒词交流、交流随时打断等多项突破,人机交互越来越流畅自然。

  “不仅中文语音合成技术取得突破,在今年的全球语音合成大赛中,科大讯飞的语音合成技术能够声情并茂讲英文故事,在多种语言的测试中表现不俗。”刘庆峰说。

  让机器人“开口”说话的技术并不新鲜,电子万年历、计算器上都能用得到,但要像人一样说得自然流利、有声调起伏,并非易事。

  记者在现场用手机试用科大讯飞开发的语音合成软件,发现语音合成功能不仅能将文字信息转化为可听的声音信息,还能将某个人的声线特征收入语音库中,然后用很短的时间将文本用被模仿者的声线特点读出来,确有以假乱真之效。未来,人们的声音也可能存在被“盗”用的风险。(记者白国龙)新华社北京电

(责任编辑:王蔚)

热点推荐

SpaceX今年第7次发射  共向国际空间站运2.63吨物资

SpaceX今年第7次发射 共向国际空间站运2.63吨物资

据国外媒体报道,美国当地时间4月2日,SpaceX已成...

携手世界 为破解人类科学难题贡献中国智慧

携手世界 为破解人类科学难题贡献中国智慧

在蔚蓝的大海中,国际大洋钻探计划正在钻探地球的...

苹果允许用户彻底删除ID 重隐私者得天下

苹果允许用户彻底删除ID 重隐私者得天下

北京时间3月30日,据彭博社报道,苹果公司表示将在...

eSIM时代,运营商的末日还是新生

eSIM时代,运营商的末日还是新生

自近日中国联通宣布在国内首发Apple Watch Series ...

首枚会变色的“心脏芯片”问世

首枚会变色的“心脏芯片”问世

东南大学生物医学工程学院生物电子学国家重点实验...

“科学”号调查麦哲伦海山

“科学”号调查麦哲伦海山

海山是世界海洋生物多样性研究的热点地区。在国家...

别了,“天宫” 你是永远的“一号”

别了,“天宫” 你是永远的“一号”

2011年9月29日,你乘坐长征二号F运载火箭离我们而...