当前位置:首页 > 新闻资讯 > IT业界 > 新闻
第五回 机器在聆听
  • 2017/3/14 11:01:12
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】传说有点悲凉,却反映人类一直存在的美好梦想。重建巴别塔,也成了人类语言沟通和共识达成的象征和代名词。现在,AI让人类的梦想一步步走向实现。

@陈宗周

     《圣经》中记载着这样的传说,远古人类都讲一种语言,他们希望建造一座通往天堂的高塔,这就是通天塔,也叫巴别塔(Tower of Babel)。为了阻止人类的计划,上帝让人类说不同的语言,分成不同的民族,在语言上无法自由沟通,巴别塔计划由此告终。

      传说有点悲凉,却反映人类一直存在的美好梦想。重建巴别塔,也成了人类语言沟通和共识达成的象征和代名词。现在,AI让人类的梦想一步步走向实现。

 

弗雷德里克·贾里尼克

历史的探索

      让人类拆掉语言的樊篱,实现无障碍沟通,这项伟大的AI工程有三块重要基石:语音识别、自然语言理解、语音合成。三块基石是三大类技术,分别解决人类语言交流中三个问题:听清楚别人说什么、 理解别人说什么、根据听到和理解的去回答别人。

      语音识别,主要解决“听清楚别人说什么” 这个难题,这是AI中的重要技术领域。近年来,由于深度学习技术的应用,语音识别取得了长足进步。

      1952年,贝尔实验室的K·H·戴维斯(K.H.Davis)等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国人彼得·迪恩斯(Peter Denes)等研制了第一个计算机语音识别系统。但从上世纪50年代到70年代,语音识别研究走了弯路,那就是简单地想电脑模拟人脑,认为必须先让机器理解自然语言。在当时计算机能力受限的情况下,这样的研究鲜有进展。

      直到1970年后,统计语言学的出现打破了沉寂。领军人物是IBM沃森实验室的弗雷德里克·贾里尼克(Frederick Jelinek)。

      贾里尼克用两个隐(含)马尔可夫模型(Hidden Markov Model)——声学模型和语言模型来清楚概括语音识别。这个框架至今对语言处理有着深远影响。

      1999年,国际声学、语音与信号处理国际会议(ICASSP)在凤凰城召开,早已当选美国工程院院士的贾里尼克在大会上做了一个报告,题目是《从水门事件到莫尼卡·莱温斯基》。这两件事和语音都有联系,而且两件事的时间跨度和语音识别都同样很长。隐马尔可夫模型处理语音也是从1972年开始,一直到贾里尼克作报告时还在进行。隐马尔可夫模型处理语音,一直持续到贾里尼克作报告时还在进行,而且还将延续下去。

 

本文出自2017-03-13出版的《电脑报》2017年第10期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖