首页  »  科学  »  科学探索

视觉识别奥赛华人包揽冠军中企首获世界第一

2015-12-31 10:19:22

来源:人民网-科技频道

人民网北京12月29日电 (记者 申孟哲)美国东部时间12月10日,素有“计算机视觉奥林匹克”之称的ImageNet结果揭晓。此次比赛有微软、三星、高通、腾讯、UIUC等业界和学界巨头参与,三支华人科学家团队则囊括了所有冠军。来自国内的商汤科技(SenseTime),更是成为首个在此项赛事中夺魁的中国企业。《纽约时报》对这项赛事结果第一时间进行了报道。

首夺世界冠军的中国企业

在计算机视觉领域,ImageNet堪称发展风向标,在学界和业界都有着深远影响。

中国企业此次夺魁的“视频物体检测”比赛,是今年ImageNet的新增比赛任务,需要在运动的连续视频中检测物体位置、同时识别物体类别,堪称此次比赛中难度最大的领域。一旦该技术成熟,在无人机、交通、安防、电影、动画等领域都将迎来巨大的应用空间。

这项赛事中夺冠的团队,由香港中文大学欧阳万里教授和商汤科技主任研究员闫俊杰领衔,在检测数量、检测准确率两项指标上都获得了世界第一,其中检测准确率更是超过60%。要知道,在四年前的首届ImageNet上,冠军对于静态图片物体的检测准确率也仅为8%。

这并非香港中文大学在此项赛事上首次一鸣惊人。该校的多媒体实验室由汤晓鸥教授创立,是最早应用深度学习进行计算机视觉研究的华人团队。在去年的ImageNet上,该实验室团队就曾获得世界第二名,仅次于谷歌;同样是在去年,在另一项世界级人工智能竞赛LFW(大规模人脸识别竞赛)上,该实验室曾力压FaceBook夺得冠军,使得人工智能在该领域的识别能力首次超越真人,引爆科技界,并直接催生了之后该项技术的大规模商用浪潮。

领跑视觉技术的华人科学家

ImageNet由斯坦福、卡耐基梅隆、北卡罗莱纳、密歇根等一流名校发起。现在,它正在迎来华人科学家“包圆儿”的时代。

比如,在图像中物体定位、检测比赛中获得多项冠军的微软研究院团队,就是由4位中国科学家组成。该团队研究员何恺明博士,同样毕业于香港中文大学多媒体实验室,2009年,他就成为首获计算机视觉领域三大国际会议之一CVPR“最佳论文奖”的中国学者。

而在图像中物体定位等任务中取得世界第一的,同样是由华人科学家率领的团队——悉尼科技大学陶大程教授、邓健康博士、和南京信息工程大学刘青山教授领衔此团队。值得一提的是,2015年获颁澳大利亚科学最高荣誉尤里卡奖的陶大程,也出身于港中大多媒体实验室。

在计算机视觉这项“烧钱”又存在重重技术困难的领域,历届ImageNet中,都体现出巨大的技术壁垒。自2010年创办以来,ImageNet 的参赛者中,不乏人工智能巨头,包括谷歌、百度、微软、高通、IBM、NEC、Adobe、三星、INRIA、牛津大学、伯克利大学等;而冠军,则大多由谷歌,微软、NEC等工业界巨头,以及多伦多大学、东京大学等名校获得。

纵览此次夺冠的所有团队,无一例外地,都吸纳了大量的知名教授、优秀博士生。

打通学界与工业界

在ImageNet中,每隔一段时间,就会增加一项学术和工业界公认的最难的任务。例如,2013年新增的图像中的物体检测任务,需要同时标出图像中所有物体位置并识别,是当时人工智能的研究热点。而今年新增的“视频中通用物体检测”,则是首次引入的视频任务,除了难度更高之外,其对于工业界的实用价值也更强,更好地反映了市场的需求。

2012年至今,随着人工智能突破性新技术—深度学习方法不断进步,计算机视觉技术也进入了黄金发展期。作为最“烧脑”的行业之一,人工智能也的确需要这样的合作。

商汤科技CEO徐立表示,深度学习给人工智能领域带来了巨大变革,传统工业界和科技界都需要有储备和准备应对这场变革。

“利用深度模型在竞赛中学习得到的特征可以被广泛应用;由 ImageNet 训练得到的深度学习模型,将会是推动人工智能在视觉领域发展的强大引擎。我们希望用持续积累的原创力量推动这场变革,帮助更多的企业,尤其是中国企业把现有产品与科技前沿的成果有地融合,让中国的消费者更早享受到科技进步的改变。”徐立说。

陶大程则十分看好学术界与工业界的合作前景:“我们这支参赛队伍由悉尼科技大学、南京信息工程大学联合组成,并获得了AMAX的硬件支持。大公司的优势在于硬件、人力资源方面的整合能力,学术界则能够提供很多创新的想法。港中文多媒体实验室和商汤科技的联手夺冠,也是很成功的范例。大家合作研究技术与产品,这不仅仅是某一个实验室、某一家公司的事情,而是整个人工智能界的必由之路。

  • 相关阅读
  • 易信Win10 UWP版节前抢先上架 视觉体验全面优化

    随着2016年春节的临近,各大应用市场开始逐渐热闹起来。近日,移动社交软件易信官方表示,为了满足更多WP用户的节日社交需求,易信WP版在节前抢先上线了首个Win10 UWP通用版本。UWP即Universal Windows Platform的简...

    时间:12-10
  • 《黑猫警长》终极预告片曝光 视觉效果升级(图)

    今日,动画电影《黑猫警长之翡翠之星》终极预告片曝光,从城市森林到宇宙大战,场景壮观炫酷,视觉效果全面升级的同时,超前的科技感、现代感袭面而来...

    时间:07-30
  • 国民视觉健康报告:2020年中国近视人数或超7亿

    原标题:2020年中国近视人数或超7亿   近日,北京大学中国健康发展研究中心李玲团队在京正式发布《国民视觉健康报告》(以下简称《报告》)。《报告》显示,2012年我国5岁以上人群中,近视和远视的患病人数约有5亿...

    时间:06-09
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。