当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
人工智能从交谈开始!玩转语音交互
  • 2017/2/16 10:20:11
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】出于人类的天性,我们对未知事物总是充满了好奇与恐惧。在各种科幻小时/电影中,人们总是赋予机器智慧,却同时害怕着拥有自主意识的机器人

出于人类的天性,我们对未知事物总是充满了好奇与恐惧。在各种科幻小时/电影中,人们总是赋予机器智慧,却同时害怕着拥有自主意识的机器人,这样纠结的心态同样出现在了AI(人工智能领域),人们在彷徨中不断推进着机器智慧的成长,却又担心着机器对人的替代。当好奇压到恐惧的时候,人们尝试同机器交互与沟通,而“说”背后的语音交互则成为大众接触人工智能的开始。

 


能交谈的虚拟助手

“Alexa,请为我播放 Fiorella Pierobon的Moonlight Shadow。”

“Siri,给Jony发个短信,告诉他我可能会晚点到咖啡厅。”

“Cortana,帮我预定辆出租车,13点30在公司门口上车”

……

      从天气查询、拨打电话、短信收发、翻译等命令式的基本应用功能到出行路线规划、车辆/航班预定、美食推荐等需要信息采集、归纳、对比、决策的深度生活服务应用,语音助手基本都能实现,长时间的沉淀让语音助手从最初单纯到有些死板的“功能”成长为看不到的助手,借助底层算法、网络通信、电子电路等物联网生态,语音助手完全可以实现家居家电乃至汽车的控制。为你开门、开灯、调整室内温度甚至询问晚餐牛扒需要几分熟,语音助手足以成为家里见不到却可以实现交谈的虚拟助手,当然,我们也可以借助投影或者机器人、移动设备将其具象化。

 

当前语音助手具有极强实用性

      这样的助手不会有伤风感冒,更不会将个人情绪带入工作中,随着大数据资料的采集,它们甚至会比家人更了解你。不过就目前而言,这样近乎“无缝”的应用体验离实现还有一段距离,语音助手同真实人工助手的差距依旧存在,网络上各种针对Siri或者Cortana的调戏攻略便是语音交互暂不成熟的表现。

 

      语音识别是语音交互首要难点,人们并不担心听不懂机器“说”出来的话语,无论是英文还是中文,语音助手表达时的语音还是相当清晰准确的,但机器听懂或者说识别人类的语音却一直是语音交互技术需要重点攻克的难关,好在后期大数据、云计算技术的逐渐成熟,语音助手的开发者们能够借助海量数据让语音助手采样、学习,借助云计算提高最终辨识率。此外,随着人们对语音交互应用需求的提升,人与机器完成交互的同时,往往还需要机器与机器间配合实现应用,这又对语音交互的跨平台和移植性提出要求。

 

中文与英文的伪阵营

        “我恨你”——不同的语境、情感会表达出截然不同的意思,汉语是全球使用人数最多的语言,而英语是全球使用国家最多的语言,两者的区隔加上不同的地域企业,很容易形成不同的阵营。但实际上,机器并不会对汉语或者英语有特殊的偏好,语音交互系统的强弱更多体现在其深度学习网络、建模结构、标本数据库等,2016年跳跃式崛起的亚马逊Alexa虽然对汉语不太感冒,但苹果的Siri、微软的Cortana和谷歌的谷歌助理在识别汉语上也投入了很多资源。通过语言来划分语音交互应用并不合理,我们更倾向用“本土”和“海外”来划分语音交互应用,将Siri、Cortana划分到“海外”阵营,而百度、科大讯飞、哦啦、云知声等划分到“本土”阵营。

 

本土语音交互大混斗

      “海外”阵营中苹果的Siri、亚马逊的Alexa、微软的Cortana以及谷歌的谷歌助理之所以被国内消费者熟知,很大程度在于各自背后的巨头具有较高的知名度,其实光美国便有近百家专注语音交互的初创企业,派系同样相当复杂,而“本土”阵营经过这些年的发展,成长趋势相对明确且更接地气儿一些,也就成为本次语音交互体验的核心。

       目前“本土”语音交互阵营主要分为2B和2C两大阵营,百度这样的巨头虽有推出“度秘”这样类似小冰的对话机器人,度秘在应用功能上基本完成了对早期百度语音助手的替代,成为本次体验的对象。百度语音近年来加速了B端商务应用布局,语音识别、合成及唤醒三大产品借助海尔、乐视、中兴、联想、比亚迪等合作伙伴不断渗透进入交通出行、应用助手、智能家居、社交聊天、游戏娱乐等领域,生态布局明显。

 

百度语音助手近年来侧重B端合作,以生态形式布局语音交互领域

       国内另一语音交互巨头科大讯飞则同步布局B端商务和C端个人应用市场,而哦啦语音、哦啦语音则侧重C端个人应用市场,至于云知声则倾向B端商务应用市场,以智能家居和车载领域为目标。想要知道某一语音助手是主打B端还是C端市场,可以直接在各大应用市场搜索其名称,如有单独的App则说明它对C端个人应用市场提供服务,如没有则说明该助手主要是嵌入式地服务B端领域。

 

       本次体验将根据不同的应用场景选择相应的“本土”语音助手进行对比,以方便大家从应用出发选择相应的产品,并了解相关应用助手特性。

 

本文出自2017-02-13出版的《电脑报》2017年第06期 A.新闻周刊
(网站编辑:shixi01)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖