当前位置:首页 > 新闻资讯 > IT业界 > 新闻
AI传奇第四回 助飞的双翼
  • 2017/3/8 9:42:37
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】深度学习就像一只雄鹰,高飞还需要强劲的翅膀。而装上这两只翅膀,两位华人发挥了很大的作用。

ImageNet缔造者:拼命三郎李飞飞

 

李飞飞

      创建ImageNet的斯坦福大学AI实验室主任李飞飞(Fei Fei Lee), 则是与深度学习密不可分的另一硅谷华人传奇。

      李飞飞1976年出生于北京,16岁随父母去了美国。刚到美国日子非常艰难,父亲给别人修照相机,妈妈当收银员,而她一边上学一边去中国餐厅打工。在这样的情况下,自称拼命三郎的李飞飞考上普林斯顿大学物理系,获得全额奖学金。

      1999年大学毕业后,她放弃华尔街10万美元年薪,选择去西藏研究藏医一年。然后,获得全新人生感悟的她,去了加州理工学院电子工程系读AI专业博士,            

      她进校时正是AI低潮期。母亲此时不幸中风还患上癌症,学习、科研与生活多副重担压在她身上。 “如果重新来一次,我不认为自己还能挺过来” 她事后对人这样说。

      但是,华人女子李飞飞无比强大的内心支撑她度过艰难。然后,她创造了一项项学术奇迹。从加州理工学院到斯坦福大学,她发表超过100篇AI学术论文,33 岁获得了斯坦福大学终身教授职位,又成为该校著名的AI实验室主任。

      真正使李飞飞名扬世界的,是她创建的ImageNet。我们在第三回已经看到,正是由于这个图像大数据平台,深度学习走向辉煌。

      从2007年开始,ImageNet下载了近10亿张图片。这是一个无比庞大的数据集,要对这些数据进行标注,工作非常繁浩。李飞飞巧妙地在亚马逊网站土耳其机器人(Mechanical Turk)平台上,用互联网众包模式来标注这些图片。高峰期时,ImageNet是亚马逊土耳其机器人平台上最大雇主之一,来自167个国家的近5万人,用众包方式协同工作,筛选、排序、标注了近10亿张照片。

      李飞飞回忆说,现在回头去看,用大数据来训练计算机算法的做法重要意义显而易见。在这段旅途中,她觉得自己非常孤独,研究经费方面也一直遇到麻烦。

      2009年,ImageNet终于诞生了。这是有1500万张经过标注图片、含22000类物品的数据库,仅仅是猫,就有超过62000只、长相姿势各异的不同品种家猫和野猫。无论在质量上还是数量上,这都是一个规模空前的数据库。只有在互联网时代,深度学习这样的卓越创造,才能因大数据而升华。

      大数据威力很快显示出来了,ImageNet大数据集开源,成为检验各种AI算法的最权威平台,也成为评价AI 科研机构和科技公司AI 实力的最好竞技场,自然成为全球科技界和媒体关注的焦点。           

      颇有意思的是,深度学习与ImageNet也互相成全,互为造星者。2012年的ImageNet图像识别竞赛中,让计算机学习1000万张图片,然后用15万张图片进行测试,检验各种算法的识别准确率(实际上是错误率),在这样的大数据竞赛环境中,深度学习大放异彩。最不跟风追求时尚的李飞飞,也成为世界闻名的硅谷科技明星。2016年11月,李飞飞加盟谷歌公司,负责谷歌云。这位总能面对挑战的女科学家,又走上自己的新旅程。

      目睹大数据对深度学习成功的关键性作用,松尾丰这样感慨:如果互联网网页的出现能再提早15年,也许今天硅谷的王冠就应该戴在日本的头上。他仍然在为日本的五代机而惋惜,认为如果有互联网带来大数据这样的信息环境,五代机可能就成功了。这位日本专家的分析或许有偏颇,但也反映出大数据对于深度学习不可或缺。

      好风凭借力,送我上青云。深度学习借助GPU和大数据两只有力的翅膀,直上云霄。

本文出自2017-03-06出版的《电脑报》2017年第09期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖