当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
人工智能从交谈开始!玩转语音交互
  • 2017/2/16 10:20:11
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】出于人类的天性,我们对未知事物总是充满了好奇与恐惧。在各种科幻小时/电影中,人们总是赋予机器智慧,却同时害怕着拥有自主意识的机器人

叫车服务:相对失败

       对于语音助手而言,叫车服务也属于“进阶”式应用,海外阵营的Siri、Cortana、Alexa已经能够实现与用户实现在目的地确认、车型选择、车辆预订的深层交互,除预定出租车外,更通过整合地图功能帮助用户实现路径规划和成本的估算,已经为未来出行路线的规划应打下了基础。

 

       本土阵营的语音助手在这块的表现上多少令人有些失望,“要去机场,帮我叫车”这样的测试指令首先需要语音助手调动地理位置信息,类似询问天气一样判定用户所处位置,然后调动软件自身或第三方服务叫车,最好还可以通过大数据和云计算做路线规划,可实际情况是度秘明确表示打车服务升级中,搜狗则显示不知所谓的文字搜索结果,哦啦更是直接来了个调侃式的“没听明白,要不聊点别的如何?”。

 

本土阵营的语音助手基本无法实现叫车应用

 

       唯独灵犀在识别并调用出了叫车软件,它需要用户手动输入目的地、联系电话等,而且诡异的是它调动的叫车软件是“快的”。综合来看,本土阵营的语音助手暂时全部败在了叫车应用上。这让酒店和航班预定等测试变得鸡肋,毕竟叫车应用已经失败,而更完善的出行服务国内用户本身也很少用。

 

软件启动:差强人意

       语音助手在安装和使用过程中都需要用户“下放”非常多的权限,本身想要更好地体验语音助手或者说“偷懒”,我们也基本上都满足了语音助手对手机权限的索取,但在最基本的软件启动应用上,结果也很让笔者失望。

 

度秘和搜狗无法直接完成软件启动应用

 

        四款语音助手都很准确地识别出“打开东方财富软件”这条语音命令,但搜狗却是弹出软件界面,需要用户手动点选确认启动,而度秘更是显示了一堆百度“疑难杂症”问题搜索结果,倒是哦啦和灵犀非常快速地启动了软件。软件启动可以说是语音助手控制智能家居、汽车等硬件设备的第一步,相比物联网的垮设备应用,如果连最基本的本地软件都无法准确启动,跨平台、跨设备应用恐怕值得考量了。

 

综合评定:结果出人意料

        在语音输入环节,讯飞带来的输入体验绝对是“惊艳”,即使笔者这样习惯拇指高效输入的“写手”,也绝对跟不上讯飞语音输入法的转录效率,而且在保持高效的同时,其普通话识别的准确率也非常不错,对于习惯在微信等社交群里“侃大山”的玩家或者淘宝客服一类工作人员,讯飞绝对是值得尝试的语音输入法。

 

         而在生活化服务应用方面,C端语音助手应用的表现则具有较大差异,原本以为非常简单的电话拨打、短些发送这样的基本应用却因为汉子同音字以及一人多号的问题成为鸡肋,这也算出人意料了。在天气问询、音乐播放环节则各有优劣,不过如果综合美食预定、出行规划这样的体验后,笔者发现基本没有一款语音助手能够满足所有的需求,相对而言,哦啦语音助手表现算是不错的了。

 

写在最后:去屏幕化成为考量标准

      语音交互的未来会怎么样?智能化,可智能化的标准是怎样的?正如一千个读者就有一千个哈姆雷特,每个人对于智能化都有不同的理解和认知,对于语音助手“聪明”还是“愚笨”,每一个用户都要一套自己的判别标准,笔者这里更倾向于将“去屏幕化”为语音交互智能化程度的考核标准。

 

      人与人之间的对话一定要面对面吗?答案显然是否定的,人们愿意在驾乘过程中用语音操控取代触控的原因在于语音或许能更少地让用户分心,可如果语音助手在执行指令或交互过程中,不断需要用户手动输入或点选确认,那语音交互原本的便利性何在呢?如论是嵌入式的B端语音应用还是独立的C端消费类应用,语音交互本身就应该是相对独立的存在,随着智能穿戴设备、智能家居设备的普及,传统显示屏或触控屏幕本身在未来数字化生活中就是“可有可无”的存在,语音交互技术想要成熟,必然要尽可能摆脱屏幕的束缚。

 

      当然,在实现“无屏化”这一远大目标以前,更重要的还是做好声源识别、噪声抑制、回声消除等基本的技术应用,夯实了基础才能更进一步。同机器交谈或许还有一定距离,可语音文字转录已经相当成熟了,建议大家多多体验一番。

本文出自2017-02-13出版的《电脑报》2017年第06期 A.新闻周刊
(网站编辑:shixi01)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖