首页  »  科学  »  科学探索

深度学习并未走进死胡同

2019-03-25 07:19:22

来源: 科技日报

  不久前,全球人工智能计算机视觉领域奠基人之一、约翰霍普金斯大学教授艾伦·尤尔抛出“深度学习(Deep learning)在计算机视觉领域的瓶颈已至”的观点,引发业内许多专家的共鸣和热议。

  目前,作为实现人工智能的一种形式,深度学习旨在更密切地模仿人类大脑。那么,业内专家学者是否认同这种说法?作为人工智能技术的重要基础,深度学习在发展中究竟遇到哪些困难?如果深度学习瓶颈已至,我们该如何破解这个难题?带着相关问题,科技日报记者近日采访了中外人工智能的知名专家对尤尔教授的观点深入解读。

  深度学习精到之处

  最初,深度学习刚刚进入大多数人工智能研究人员的视线时,被嗤之以鼻,但短短几年后,它的触角在诸多高科技领域延伸,横跨谷歌、微软、百度乃至推特等多家企业。

  很多高科技公司热衷探索深度学习的一种特殊形态——卷积神经网络。卷积网络是由相互连通的卷积层组成,与大脑中处理视觉信息的视觉皮层十分类似,不同之处在于,其可以重复使用一张图像中多个位置的相同过滤器。一旦卷积网络学会在某个位置识别人脸,也可以自动在其他位置识别人脸。这种原理也适用于声波和手写文字。

  业内人士认为,卷积神经网络可以使得人工神经网络能够快速接受培训,因为“内存占用空间小,不需要对图像中每个位置的过滤器进行单独存储,从而使神经网络非常适合于创建可扩展的深网(Deep nets)”。这也令卷积神经网络具有善于识别图形的优点。正是基于此,谷歌开发出安卓手机的语音识别系统、百度对可视化新型搜索引擎进行研发。

  当然,要让卷积神经网络正常运作需要功能强大的计算机和庞大的数据集,而其在收集数据或计算平均值时,效果并非十全十美。

  卷积神经网络的力挺者、脸谱(Facebook)人工智能实验室负责人伊恩·勒坤表示,目前使用最广泛的卷积神经网络几乎完全依赖于监督学习。这意味着,如果想让卷积神经网络学会如何识别某一特定对象,必须对几个样本进行标注。而无监督学习(Unsupervised learning)可以从未经标记的数据展开学习,更接近人脑的学习方式。而在此基础上开发的反向传播算法,能有效使错误率最小化,只是不太可能体现出人类大脑的运作机理。

  勒坤表示:“我们对大脑如何学习几乎是完全陌生的。尽管人们已经知道神经元突触能够自我调整,但对大脑皮层的机理尚不明晰,所知道的最终答案是无监督学习是一种更接近人脑的学习方式,但对于大脑的认知机制却无力解答。”

  瓶颈凸显需警惕

  “虽然深度学习优于其他技术,但它不是通用的,经过数年的发展,它的瓶颈已经凸显出来。”不久前,艾伦·尤尔指出。

  尤尔认为,深度学习有三大局限:首先,深度学习几乎总是需要大量的标注数据。这使得视觉研究人员的焦点过度集中于容易标注的任务,而不是重要的任务。

  其次,深网在基准数据集上表现良好,但在数据集之外的真实世界图像上,可能会出现严重失败。特别是,深网难以应付数据集中不经常发生的“罕见事件”。而在现实世界的应用中,这些情况则会产生潜在风险,因为它们对应的视觉系统故障可能导致可怕的后果。比如,用于训练自动驾驶汽车的数据集几乎从不包含“婴儿坐在路上”的情况。

  第三,深网对图像中的变化过度敏感。这种过度敏感不仅反映在对图像中难以察觉变化的标准上,还反映在对上下文的变化上,由于数据集大小的局限,过度敏感会导致系统做出错误判断,但这种因过度敏感而导致的图像变化却难以欺骗人类观察者。

  例如,在一张丛林里有只猴子的照片中,PS上一把吉他。这会导致AI将猴子误认为人类,同时将吉他误认为鸟。大概是因为它认为人类比猴子更可能携带吉他,而鸟类比吉他更可能出现在附近的丛林中。

  尤尔认为,瓶颈背后的原因是一个叫做“组合爆炸”的概念:就视觉领域而言,从组合学观点来看,真实世界的图像量太大了。任何一个数据集,不管多大,都很难表达出现实的复杂程度。更何况每个人选择物体、摆放物体的方式不一样,搭出的场景数量可以呈指数增长。而这需要无限大的数据集,无疑对训练和测试数据集提出巨大挑战。

  业内专家表示,这三大局限性问题虽还杀不死深度学习,但它们都是亟待需要警惕的信号。

  “已死”之说值得商榷

  去年,深度学习领域一位知名学者曾在脸谱发布惊人之语——深度学习已死,引起业内一片哗然,以至于现在网上机器学习社区的一些人说,搞深度学习是在走死胡同。

  “我认为‘深度学习已死’这种说法,是出自那些曾经极为看好深度学习、后来却意识到其局限的业内人士。而局限并不意味着这个事物已经死亡,我们可以补充一些东西进去。”法国泰雷兹集团首席技术官马克·厄曼向科技日报记者表示。

  “我不赞同‘深度学习已死’的提法。”新一代人工智能产业技术创新战略联盟联合秘书长、科大讯飞副总裁兼AI研究院联席院长李世鹏指出。

  李世鹏说,深度学习作为一个新的计算科学领域的方法,当然有其自身的限制和缺陷。这个在外界被炒作成万能的AI工具,其实科学界一直都很谨慎地对待,从一开始大家就知道它的一些局限性,比如对标注了的大数据依赖、非解释性、没有推理功能、对训练集里包括的样本就能工作得很好而对没有包括的样本就很差、系统模型处于非稳态(相对人类智能而言,对抗扰动攻击能力比较差)等。

  “我比较赞成尤尔教授的客观说法——深度学习在计算机视觉领域的瓶颈已至,特别是他讨论问题的这个时间点很有必要,在方向上有矫枉过正的提示作用。现在大家对深度学习热衷得有些过度,在学术界,甚至在产业界,给人一种似乎‘非深度学习非AI’的感觉。实际上这是有很大问题的,因为深度学习确实只是人工智能领域里一个被实现出来的,却比较窄的成功经验。”远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲指出。

  总而言之,李世鹏表示,深度学习已死之说法值得商榷。在未来相当一段时间里,深度学习会对人工智能发展起着积极推动作用,并具有很大的应用价值,同时,科学家对深度学习天生的缺陷和局限已明晰,正在尝试一些方法补足其现阶段发展的不足,并在各自的领域内探索着下一代人工智能的突破。(记者 华 凌)

  • 相关阅读
  • 美专家:5G技术将加大 自动驾驶汽车信息共享力度

      美国谷歌母公司“字母表”旗下的“出行新方式”公司首席技术官德米特里·多尔戈夫25日说,随着5G时代的到来,自动驾驶汽车之间信息互通共享的力度将显著加大,有助于车辆快速应对突发紧急状况。   多尔戈夫...

    时间:03-27
  • 2018中国人工智能指数报告发布

      长江商学院人工智能与制度研究中心联合武汉大学大数据与云计算实验室共同发布了《2018中国人工智能指数》报告。报告从学术、产业等方面,度量中国人工智能在最近十几年的发展和影响。   报告显示,中国在人...

    时间:03-27
  • 科学基金改革: 突出“从0到1”原创导向

      “基础研究的重要性怎么强调都不为过,国家对其投入也不断加大,接下来要考虑的问题是如何提高基础研究水平,产出更多原创性成果。”科技部部长王志刚在26日召开的第八届国家自然科学基金委员会(以下简称自...

    时间:03-27
  • 续驶里程400公里以上补贴2.5万元

      3月26日,财政部、工业和信息化部、科技部、发展改革委联合发布《关于进一步完善新能源汽车推广应用财政补贴政策的通知》,以促进产业优胜劣汰,防止市场大起大落。   据财政部官网介绍,随着新能源汽车产...

    时间:03-27
  • 版号解冻三个月 游戏行业冬去春来?

      “原本我们计划在一个月内开始对游戏进行宣发然后上线,但没想到游戏团队已经基本解散了。”版号重启后,终于在第八批等来版号的林墨(化名)愁容未减,他所在的游戏公司已经整整一年没有获得过版号,不少已...

    时间:03-27
  • 硬件缺席 苹果“复活”改打服务牌

      3月26日凌晨,备受期待的苹果2019春季发布会明显惊喜不足,随即被贴上“最软发布会”标签。   正如此前预测,发布会上不见硬件推出,服务成了主角——涵盖杂志订阅的Apple News+、希望取代信用卡的Apple C...

    时间:03-27
  • 首次全女性太空行走取消 竟因航天服“不合身”

      北京时间26日凌晨,美国国家航空航天局(NASA)宣布,原定于29日在国际空间站实施的太空行走由“女子双打”改为“男女混双”,航天史上首次全女性太空行走最终未能成行。   3月6日,NASA宣布由安妮·麦克莱...

    时间:03-27
  • 我重型运载火箭发动机联试成功

      记者26日从中国航天科技集团获悉,由该集团六院研制的500吨级液氧煤油发动机,24日成功完成燃气发生器—涡轮泵联动试验。这标志着我国500吨级重型运载火箭发动机关键技术攻关及方案深化论证达到预期目标,为...

    时间:03-27
  • 接入公共Wi-Fi不要使用支付类应用

      最近,关于Wi-Fi的新闻总让人有些忧虑。前不久,央视3·15晚会曝光了Wi-Fi探针盒子,它可以迅速识别出用户手机的MAC地址,在神不知鬼不觉中进行所谓的用户画像。近日,在加拿大温哥华举办的世界顶级信息安全...

    时间:03-27
  • 智能家电不再“各说各话”

      家电业智能化热潮涌动,但各品牌各自为战,智能家电“互联互通难”是一大痛点,中国家用电器协会推出《智能家电云云互联互通标准》,实现了跨厂商间设备的互通协作。   随着越来越多的家用电器具接入互联网...

    时间:03-27
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。