当前位置:首页 > 新闻资讯 > IT业界 > 新闻
云知声: 成立几个月让讯飞加班半年,更不怕BAT和谷歌亚马逊,它凭什么?
  • 2017/3/29 9:57:05
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:黄旭、熊雯琳
【电脑报在线】2011年,AI初创企业只有70家。2015年,就已经超过了400家,增长近6倍。到了2016年,中国AI企业709家,全球每10.9个小时诞生一家人工智能企业。

对话:

AI是产品与技术结合的“万金油”

 

 黄伟

我们的选择都是顺势而为

  AI与机器人:根据我们了解,目前云知声主要聚焦在智能家居、医疗和车载三个行业,选择这几个领域的理由是什么?

   黄伟:我们的选择并没有刻意选择某个领域,除了技术成熟以外,更多是市场的成熟度。

   AI是一种非常基础的资源,对各个行业来说都是赋能的,我们是把相对成熟的技术去引入,顺势而为。比如智能家居领域,已经历了联网化的改造。格力、美的出货设备中联网产品占比已经相当高,具备了与人工智能结合的条件。

    医疗领域同样如此,在2013年,医院信息化还是只有WIFI,那时候谈AI根本不可能。但今天,随着深度学习、大数据的积累,我们技术指标上在语音识别的准确率能做到97%-98%,即便是比较嘈杂的环境,也可以做到90%以上的识别,AI与医院信息化的结合,有了一个新的机会。

   AI与机器人:从2012年就开始进入人工智能领域,云知声并没有选择去做2C的领域,也没有做App,而是切入人工智能2B,为什么?

   黄伟:这可能和我以前从业背景有关。并不是说,我们没有互联网基因,所以不会做APP,实际上,从摩托罗拉到盛大,我可能是人工智能创业团队中最具备互联网基因的。

   创业开始时,Siri等各种语音助手很火,但我们认为,这类语音助手注定是个伪命题,一定不会成功。因为AI并不是一个产品,它是一个赋能技术,是“万金油”,比如人脸识别和安防结合才是产品,如果AI没有应用场景,用户是无感的。我们需要做的,是切入这一领域时,将语音助手和场景结合,使得它可以服务于各行各业。比如乐视电视遥控器的语音控制。


商业模式主要来自芯片授权费

     AI与机器人:语音识别领域现在竞争非常的激烈,和百度、科大讯飞、亚马逊、搜狗相比,云知声的优势在哪里?

     黄伟:行业竞争和共同进步是好事。在我们诞生以前,讯飞是没有压力的。但2012年9月我们发布语音识别,做到准确率85%,超过科大讯飞的80%。这导致科大讯飞加班了大半年,追上了我们。讯飞在产品上经验更加完善,值得我们学习。竞争会促进行业发展,比寡头垄断进步更快。

BAT做人工智能,反而我们并不担心,它们的AI都是为了给现有的主营业务来服务的。比如阿里为电商服务,腾讯为社交服务,百度为搜索,它们的能力是有边界的。一旦下沉到具体领域,我们还是有非常大的先发优势。

AI与机器人:目前云知声商业模式是怎样的?是如何将技术、数据和商业闭环打通起来的?

黄伟:商业模式目前主要来自收取芯片授权费用。比如给格力、美的提供包含服务费的芯片模组价格。医院则是安装系统收费的模式,比如北京协和医院,我们帮助他们部署了约600个工作站。

通过这些设备的落地,云知声可以获得更多有价值的垂直数据,AI公司只有拿到数据和使用数据,公司未来才有更大的空间。

 

听懂的同时,还要告诉你怎么做

AI与机器人:现在云知声的引擎已经到了3.0版本,从1.0到3.0的迭代,从技术到产品都经历了哪些过程?

黄伟:广度和高度上都有很大的变化。1.0时,基本是单纯的语音识别,到今天的3.0版本,产品从信号层面到云的感知层面、自然语言理解层面,都已经非常完善了,这是广度的变化。

高度上,我们的识别率从1.0版本的85%提升到到3.0版本的97%。如今,口音和噪音识别都不是问题。都可以通过数据加算法的方式来实现的。远讲则可能会是个挑战。

AI与机器人:现在版本运用到实际产品中,比如说智能空调,或者智能家居设备,是否已经可以实现自然语言的交互,和你理想中的智能家居应用、交互场景还有多大的差距?

黄伟:感知,认知,到通用,这是我理想中的人工智能交互场景。现在才是感知和认知的初步阶段。

     即便我们现在用了语用计算,还是不够智能,还有很多专业知识需要补充和完善。比如好的语音助理不仅是帮你纪录,不光要听懂你说的,还能帮你预测和规划一些你不知道的东西,比如助理知道你要出差去上海,但上海在下暴雨,那么会提醒你带雨具。

    “能够听懂的同时,还要告诉你怎么做。”要实现这一点,背后还有很多专业知识库需要构建。此外这些对话并不拟人化,还缺乏情感计算。这些都是技术限制的局限性,在主动思维和个性化上,还有很长的路要走。尤其是情感计算,我们会尝试在4.0版本里加入情感计算,它可能既不是语音也不是图像,但是一个趋势和方向。


本文出自2017-03-20出版的《电脑报》2017年第11期 A.新闻周刊
(网站编辑:shixi01)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖