当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
聊了那么久的AI 谷歌今年想为你的数字生活“谋福祉”
  • 2018/5/14 9:45:21
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】当地时间5月8日上午,谷歌I/O 2018开发者大会在其山景城总部附近的Shoreline露天剧场正式开幕,这是自谷歌CEO桑达尔•皮蔡(Sundar Pichai)在2016年的I/O大会上提出由“移动优先(Mobile First)”转向“人工智能优先(AI First)”战略后的第二年。 AI依旧在全面而深刻地改变着谷歌和谷歌旗下的软硬件产品,但和过去两年的大会有所不同的是,当技术全面落地产品之后,今年谷歌聊得更多的是如何为人们构建更美好的数字生活。

“嗯哼”,智能语音助手可不是“一问一答”

今年Keynote主题演讲现场,台上台下则有两次互动让我格外印象深刻:一次是谷歌CEO向人们展示AI加持的GBoard如何帮助残障人士重新发声时台下爆发的掌声,另一次则是谷歌的智能语音助手Google Assistant在帮用户打电话预约美发沙龙时。

“我这里有位女顾客要做头发,我打电话来预约一下”,根据用户的指令,谷歌智能语音助手拨通了一家美发沙龙的电话:“请问你们的美发师5月3日还有空档吗?”

“我看一下,稍等。”

“嗯哼。”

台下观众大笑。

 

谷歌智能语音助手将比对手更进一步

没错,“嗯哼”这个语气词,出自谷歌智能语音助手。谷歌CEO桑达尔·皮蔡介绍说,他们所展示的是语音助手打给一段理发店的真实录音。通话过程中,语音助手不仅在发音、音调、停顿上与人类说话高度相似,丝毫没有让理发店接待员查觉到自己的身份,在一些稍显复杂的对话环节中,“它”的应对也非常自然,展现出了对口语化表达的惊人理解能力。

而如果说这个使用场景让许多人感到惊喜的话,皮蔡展示的下一个场景则又让人觉得有些惊悚在这个演示场景中,英语水平一般的人类接线员反而表现出了对于对话的混乱理解,但AI的表现却很优秀,它不仅铭记着自己的核心任务是什么保证不被“带偏”,还能根据人类的回答及时消除沟通中出现的误会。

“嗯哼”这样的语气词完美地掩盖了Google Assistant的智能语音助手身份

而在以上两个场景中,电话另一头的人类都没能听出智能语音助手的AI身份。

AI打电话背后的技术叫做Google Duplex。皮蔡说,谷歌多年来在自然语言理解、深度学习和语音转文字上投入了巨量的研究心血,而Duplex正是对这三大技术的融会贯通:“并不是所有的通话都能像这样完美,Duplex还有很长的路要走。但这项技术目前已经能够理解对话的上下文,并区分每句话所表达的细微的意义差别。”皮蔡强调说,Google Duplex还在研发中,但他们计划今年夏天就把这个技术开放给用户进行测试。届时,用户也不需要不断使用“OK Google”来对其进行唤醒,它可以像一个真正“助手”那样理解聊天语境并与用户进行持续对话。

互联网飞速发展的时代曾流传过一句玩笑话:“坐在电脑后的不知是人是狗”,但在谷歌智能语音助手这里,电话背后藏着的或许是一只“阿尔法狗(AlphaGo)”吧?

除了智能语音助手之外,谷歌还在Keynote现场展示了联想制造的智能显示设备(Smart Display),同样搭载谷歌智能语音助手,演示场景则是厨房烹饪——用户用语音询问菜谱,然后可以跟着屏幕上的图文或视频提示一步一步“做大餐”。

出门找路问手机:AR实景导航来了

讲到谷歌地图时,负责该项目的演讲人开始自嘲说:“很多人应该都和我一样,打开地图后将自己想象成屏幕中间这个小点,拿着手机转一转看看小点怎么动,才能确定自己应该朝着哪边走。”

为了解决这个日常生活中的“小麻烦”,新版谷歌地图加入了AR实景导航功能。这个功能基于谷歌新推出的“视觉定位系统(VPS)”,借助计算机视觉和GPS信息来进行导航。进行步行导航时,我们只需要打开手机摄像头“看看周围”,手机就能在片刻之后识别出你的具体位置和周边环境。

随后,取景器下方会照常呈现对应的谷歌地图导航信息,提示行进路线、预计到达时间和剩余里程;但导航界面的上半部分,则用AR的方式在周围的建筑上为我们打好了“指路标记”。过完这条马路之后下个路口该左转还是右转?路口商店门口就飘动着一个大大的左转箭头。

当然,3D地图已经普及的今天,依然有不少人在“找路”这件事情上力不从心,为了防止有人觉得AR实景导航依然不够直观,谷歌还为地图应用加入了一只可爱的AR宠物来“引路”。出门在外找不到路,跟着它走就对了。

AR萌宠带你找路

这种借相机打破虚拟和现实界限的招数,本届I/O大会上谷歌还为我们演示了不少。

比如去年推出的Google Lens,今年就将被正式整合进入谷歌、LG、小米、HMD等诸多厂商的手机相机当中,借助图像识别和知识图谱,我们拍拍照就能直接在网络上找到眼前事物的相关信息:将相机对准《复仇者联盟3》的海报,电影预告片、演员表和电影票购票通道就会出现在屏幕上;出国旅游看到不认识的菜单,打开相机就能看见菜单的实时翻译结果;Google Lens甚至还能提供与国内“拍立淘”类似的用户体验,打开相机对准一件衣服,相关的搭配、电商信息就会立即出现在我们的屏幕上。

关于图像识别还有一个有意思的地方,桑达尔·皮蔡说我们经常需要用相机拍下一些重要的文件、书页用于存档,但出于各种限制,拍摄的角度和质量往往都很一般。而新版谷歌相册会对这些照片进行OCR识别,将它们自动转化为更美观、可读性更高的版本。

Android系统竟关注“数字成瘾”?

除了展示各种让生活更美好的技术应用案例,“数字福祉(digital wellbeing)”也是谷歌在I/O大会Keynote演讲中反复提到的一个词。

手机操作系统也不例外,在最新版本的Android P中,“数字福祉”既是核心理念也是亮点功能。

当各种App都在想方设法留住用户时,谷歌却为Android系统一口气加入了四项围绕“健康数字生活”主题的防沉迷功能,包括用于展示用户手机使用习惯偏好的原生量化工具应用Dashboard,为应用设置使用时长上限、超时后不断提醒用户放下手机的App Timer,只需翻转手机即可完全屏蔽任何视觉和听觉打扰的增强型勿扰功能Shush以及在既定入睡时间到来时自动切换至勿扰模式同时灰阶显示屏幕内容的Wind Down。

将手机翻转过来就能直接屏蔽掉所有视觉和听觉打扰

 “Android P在易用性方面的改进其实是希望我们能够更加高效地完成一件事,然后放下手机,把时间花在真正重要的现实生活上”负责谷歌Android操作系统项目的Dave Burke这样说道。

这可以看作是谷歌和Android团队对于近来“反科技成瘾”浪潮的一种回应。今年2月, 谷歌、Facebook和Mozilla 等科技巨头的部分前员工共同组建了非营利组织“Center for Humane Technology”,并和Common Sense共同发起了“科技真相(The Truth About Tech)”运动,希望能够借此“应对数字时代的注意力危机,使技术与人类的最大利益保持一致。”

链接·Waymo让无人驾驶成为你的“好司机”

Keynote主题演讲的最后环节,与谷歌同为Alphabet旗下的自动驾驶技术公司Waymo也上台亮了个相。

上台演讲的是Waymo的总裁 John Krafcik,不过他们与其说是在汇报工作,倒不如说是在“炫技”。Krafcik说,深度学习在Waymo的自动驾驶汽车中广泛而深入的应用,让行人检测的错误率已经降低到了之前技术的百分之一,现在的Waymo无人车可以轻松识别出那些对同行来说十分困难的行人目标,比如扛着重物、身体大部分区域被建材板遮挡的工人,穿着恐龙外套准备过马路的Cosplay玩家,Waymo都能识别出来。

在某次路测中,Waymo无人车甚至识别出了身着Cosplay服装的行人

除此之外,深度学习也在帮助他们改善恶劣天气中的行驶表现,现在,即便是在纷纷扬扬的大雪中,Waymo自动驾驶汽车也能准确、快速地识别道路信息。

目前,Waymo自动驾驶汽车已经在公共道路上累计行驶了600万英里,接下来,他们打算与许多不同的公司合作推广自动驾驶汽车业务,今年晚些时候,美国亚利桑那州凤凰城的居民就能通过租车服务乘坐没有司机的自动驾驶汽车了。

“我们不是再造一辆更好的汽车,我们再创造一名更好的司机。”尽管今年自动驾驶汽车事故频发,但John Krafcik对Waymo信心十足。

本文出自2018-05-14出版的《电脑报》2018年第19期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖