当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
“失语症候群”救星,语音技术能为我们干点什么
  • 2015-1-4 15:39:52
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:黄兵
  • 作者:
【电脑报在线】或许,你还在抱怨自己的手机触控不准,输入法不理想,文字输入效率低。可能你真的不知道,你的手机早已支持语音输入短信(文字识别),而且识别率极高。


或许,你还在抱怨自己的手机触控不准,输入法不理想,文字输入效率低。可能你真的不知道,你的手机早已支持语音输入短信(文字识别),而且识别率极高。笔者一口气念完了109个字的一段话,完全正常识别!识别速度不到1秒!

如此牛B的语音识别来自什么高大上手机呢?1299元的魅族MX3,而已……


语音短信输入,识别时间不到1秒,而且100%准确,包括短句

       1952年,贝尔研究所,世界上首个识别10个英文数字发音的系统诞生

       1960年,英国的Denes,首个计算机语音识别系统出现

       1987年,日本开始研发高级人机口语接口和自动电话翻译系统

    ……

       2011年,苹果发布iPhone4S,集成全新语音助手Siri ,从此手机语音助手百花齐放

       可以看到,语音技术从诞生到现在已经发展了超过半个世纪,而如今随着网络与大数据服务的繁荣,语音技术的应用也突飞猛进,不但实现了高精度,也实现了高智能,同时也做到了高度的普及——大多数人身边总能找出一样或几样支持语音技术的电子产品来。但是,既然语音技术已经在我们身边悄悄地普及了,为什么知道或者是使用的人却并不算多呢?小编认为使用习惯需要培养是一方面,但不是最主要的,语音技术缺乏大力的推广、消费者缺乏对语音技术的关注与了解才是根本原因。

小知识:语音识别技术是什么?


       语音识别技术(Auto Speech Recognize,简称ASR)的作用就是让计算机能够“听懂”人类的语音,也就是通过对应的软硬件系统,将人类语音“翻译”成计算机能够识别的数字信息。ASR技术相当于给计算机系统装上了“耳朵”,使其具备“听”的能力,然后再结合庞大的数据库,对采集的语音信息进行处理,实现其他智能的功能,因此,语音识别技术是其他许多智能技术的基础。

除了语音识别,语音技术还能做这些

       在语音识别技术的基础上,可以衍生出很多以前不可想象的神奇功能,而这些功能被应用到实际产品上时,又会让这些产品的人性化程度大大提升。例如下面这些技术,就已经被广泛应用。

语音合成


       语音合成,又被称为文语转换(Text to Speech),它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术。语音合成主要作用就是将文字信息转化为声音信息,然后通过播放设备放出来,让人能够听懂计算机在“说”什么。

应用场景:手机上各种语音播放短信、微信的功能

       实际上,连Windows系统都在很早以前就支持文语转换功能了,当然那时候大家还认为这只是方便残疾人使用电脑的一个辅助功能。但现在应用在手机上就很实用了,特别是在开车时,不方便随时查看手机屏幕,当手机收到短信、微信时,就可以通过快捷的按键(智能手表、蓝牙耳机、汽车方向盘上的多功能按键……等等,总之实现的手段太多了)控制手机,让它把收到的文字信息“读”出来,这样也不用分神去看手机,对于驾驶安全来说太重要了。

自然语言处理


       有了强大的数据库支撑,计算机现在不仅仅是能“听”懂语音了,它还能对语音进行分析。例如,自然语言处理可完成词典编撰、分词断句、词性分析、语言模型、语法分析、语义分析、语用分析等工作。因此,它就可以实现信息检索、信息抽取、自动摘要、机器翻译、语音合成、语音识别、文本匹配、文本分类、对话系统等。

  

应用场景:手机上的实时语音翻译

       自己不会外语,出国旅游的时候要问个路、杀个价什么的确实很头痛。但现在方便了,一些智能手机已经集成了实时语音翻译功能,例如中兴的星星2号,你可以对着它说中文,然后它会自动翻译成外语播放出来给老外听,然后老外再对着它说外语,它再翻译成中文放给你听,应付日常对话完全够用了——这么方便的功能估计很多人都没用过吧,其实它已经在智能手机上实现多时了。

语音评测


       语音评测技术,又称为计算机辅助语言学习(Computer Assisted Language Learning),是机器自动对用户发音进行评分、检错并给出矫正指导的技术,说白了就是让计算机拿你的发音与标准数据对比,然后进行打分,再教你如何更好地发音。

应用场景:学外语APP矫正发音、网络K歌打分

       说用手机APP学外语矫正发音什么的估计很多人还觉得陌生,但一说手机K歌,大家就能说出唱吧、K歌之王、新浪好声音等等一系列APP。其实这些K歌APP也利用了语音评测机制来对玩家唱的歌进行打分。

声纹识别


       声纹识别是一种从语音信号里提取代表说话人身份的相关特征(如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等),进而识别出说话人身份的技术。它可以广泛应用于信息安全、电话银行、智能门禁以及娱乐增值等领域。

应用场景:手机声控解锁

       现在手机上炒得最火的算是指纹解锁了,但在你不方便用手指操控手机的时候(例如满手油污或是戴着厚厚的手套),用语音来解锁,然后再语音拨打电话显得更方便——当然,必须得是机主的声音才能解锁。实际上,这样的功能在智能手机上已经实现很久了,你可以在APP商店里下载一个声控解锁APP,也可以直接购买带声控解锁功能的手机来享受这样便利的功能。

语音控制无处不在,只是你忽视了它,又或是你“羞于启齿”

       可以说,从语音识别技术衍生出来的各种设备的语音控制功能并不算特别高端,它们已经存在于我们身边各种电子产品中,只是有可能我们掏钱买了产品,却并没注意到它们还有这么神奇的用法而已。下面就来看看,这些语音功能你发现了吗?

 

魅族MX4语音助手

       苹果的Siri可以说是引领了智能手机语音助手的潮流,不过后起之秀也大有长江后浪推前浪之势,国内在语音技术方面走在前面的科大讯飞就与不少手机厂商合作推出了在精准度、本地化方面都更为突出的手机语音助手,魅族MX4就是其中一款。

开启MX4的语音助手


在辅助功能中打开语音助手

       进入系统设置界面,在常规页面中选择辅助功能,然后在辅助功能页面中就可以选择打开语音助手了。魅族MX4的语音助手是与科大讯飞合作开发的,本地存储了15000条词条,在网络端更有云服务器在进行庞大的数据支撑,所以要让它发挥最强功能,手机必须要接入网络才行。

手机语音助手怎么玩?


说出“最近上映的电影”,MX4语音助手就会把它们列出来

 

和Siri一样,MX4也可以通过语音控制手机上的很多功能

  在打开语音助手功能后,魅族MX4启动语音助手的方法十分简单,只需长按Home键即可。然后就像发语音微信那样,按下话筒键就可以开始“调戏”语音助手了。

       那怎样与手机语音助手交流呢?很简单,就像平常与人那样正常对话就行,比如,你可以问“最近正在放映什么电影”、“明天天气怎样”、“附近有啥好吃的”之类,然后它就会迅速地给你答案。根据小编测试,魅族MX4的语音识别率相当高,有时候可以做到一句话一口气录完几十个字一个也不错。

       至于用语音控制手机上的各项设置与功能更是不在话下,你可以直接说出“把闹钟设置成早上7点”、“打电话给XXX”等等语句,手机就会针对这样的语音命令做出相应的动作。所以,如果你突然想不起手机某个功能在哪个菜单下开关了,不妨试试用语音来控制吧。

 

  

福特SYNC汽车语音控制系统

       用语音控制汽车?这听起来像是科幻电影里的场景,再怎么也得是007或者蝙蝠侠的座驾才会有的功能吧?其实,就像手机语音系统一样,汽车也早已引入了语音控制的功能,例如福特与微软联合开发的SYNC系统,就让汽车拥有了被“使唤”的功能。

通话、导航、放音乐,“说”要就要


拨动方向盘后方的SYNC功能拨片就能启动语音控制


说出“阅读短信”就可以播放手机上的短信


说出歌曲名或者歌手名就可以播放蓝牙设备上的歌曲

       目前,福特旗下多款新车型(翼虎、蒙迪欧等)都配备了SYNC中文语音控制系统。通过这套语音系统,你就算是手不离开方向盘、眼不离前方道路,也能接打电话、“听”短信、播放音乐与收听广播。

       要用语音控制手机来接打电话、“听”短信也很简单,把手机与行车电脑用蓝牙连接,然后导入手机电话薄,说出“呼叫XXX”(也可以直接说出电话号码),就能直接拨打电话,说出“阅读短信”,系统就会用语音播放手机上的短信。

       要用语音控制系统播放音乐,先说出存储音乐的设备,如果是在U盘里,就说“USB”,然后再说“播放歌曲XXX”(如果你不知道正在播的歌曲名,还可以问SYNC“正在播放什么”,SYNC也会用语音告诉你);如果是在手机里,则说“蓝牙音频”。

       此外,SYNC还支持语音控制GPS导航,说出目的地,即可开始导航,而收音机的语音控制,也可以通过直接说出收音频率“FMXXX”来实现。

嘴巴开关空调和导航,不用到处找开关


SYNC甚至能语音控制车载空调和导航

       通过语音来控制车载电话、实现接打电话、“听”短信、说出目的地设置GPS导航、控制收音机等功能其他很多车载语音系统都能实现,而SYNC最牛的一点在于它还可以用语音控制车载空调。

       例如,你只需要说出“打开空调,调整到摄氏23度”即可。想要调节温度,说出“提高温度”或“降低温度”,系统就会自动提高/降低一档温度。

       除了免去手动操作的麻烦外,语音控制还有另外一个好处,现在的车高科技功能繁多,中控上开关一大堆,车载电脑UI的菜单也是一大堆,经常出现找不到某个功能在哪儿开关的情况,这时候语音控制就发挥优势了,找不到咱直接说出来不就得了么。

语音控制的机器人

       让机器人真正地能听会说可谓是科学家们长久以来的奋斗目标,借助语音技术的长足发展,现在能听会说的机器人还真不少了,配合精美的外观,甚至可以让你产生置身未来的错觉!

  

互动式R2D2机器人

 

       星战迷们肯定希望自己能够拥有一台电影中的R2D2机器人,现在这个愿望可以成真了!好吧……几乎可以成真了!这台互动式R2D2机器人(美国亚马逊售价169美元)可不是简单的玩具,它是真正的机器人!它可以听懂40种语音命令并做出相应的动作,并且还内置了多种传感器,可以走路、旋转,唱歌、玩游戏、跟随主人,还可以和主人捉迷藏、玩问答游戏、对话交流等。如果不是语音识别系统足够先进,这些功能都是很难实现的。

Wowee机器人套件


       既然苹果Siri的语音控制功能如此厉害,那能不能把苹果手机当作机器人的语音控制中心?答案是肯定的。Wowee推出了一款机器人套件(美国亚马逊售价85美元),这个机器人没有脑袋,你需要把苹果手机放在它的脖子上,然后安装对应的APP,手机屏幕就会变成它的脸,同时APP也通过Siri的接口来实现各种语音控制,让机器做出不同的动作或在屏幕上显示不同的表情。或者说,它把Siri给“实体化”了。不过,Siri不是女声么,为什么不做成女性的机器人身体呢……

 

夏普COCOROBO声控扫地机器人


       前面两款机器人最多就算个智能声控玩伴,那有没有能干活又支持声控的机器人呢?当然有,而且大家都可以用得到。夏普推出了一款声控扫地机器人(淘宝代购价4800元),它可以根据使用频率、气温及充电量情况,变幻自己的“心情”,并根据各种声控操作做出相应的反应。例如,对机器人说“打扫一下房间”,当机器人心情好的时候它会回应“我知道了”,而心情普通的时候则回应“遵命”,当然,就算心情再不好,它也会去打扫房间啦。另外,该机器人还内置了摄像头,支持与主人手机远程连接。

 

你知道吗:连Windows都自带语音控制


在windows7开始菜单下方的搜索栏里搜索语音识别,就能开始语音识别设置了


Windows8的语音识别选项位于应用菜单中

       说了这么多带语音控制的设备,其实,我们用了这么久的Windows,早就内置了语音控制功能了,不管是普及率相当高的Windows7还是目前最新的Windows8,都有语音控制功能。

       从微软官方的说明就很容易理解Windows的语音控制能干啥了:“只要是鼠标与键盘能完成的工作,都可以通过语音控制实现”。

 
本文出自2015-01-05出版的《电脑报》2015年第1期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖