海康威视教你如何在ImageNet比赛中夺冠

近两个月,国内团队先后在全球权威的人脸检测评测平台FDDB和全球自动驾驶算法公开排行榜KITTI以及Cityscapes上取得非常好的成绩,这在一定程度上证明了国内计算机视觉相关算法已达到国际顶尖水平。

今年ILSVRC 2016(全称是ImageNet Large Scale Visual Recognition Challenge)分为五大部分,包括:目标检测、目标定位、视频中目标物体检测、场景分类、场景分析。在昨天,全球最为权威的计算机视觉大赛ILSVRC2016(大规模图像识别竞赛)公布了算法排名结果,Hikvision(海康威视)夺得场景分类第一名。

那么,今年的ImageNet的比赛为什么由这5部分组成?Hikvision(海康威视)是如何在场景识别一项中夺得冠军的?今天本站请到了海康威视首席科学家、海康威视研究院常务副院长蒲世亮先生为我们讲解ILSVRC2016相关的详细细节。

浦世亮,法国国家科学研究院(CNRS)博士、浙江大学博士,现任海康威视(杭州海康威视数字技术股份有限公司002415)首席科学家、研究院常务副院长、海康威视博士后科研工作站负责人、博士后导师,带领海康威视研究院的研发团队负责海康威视在视频应用领域的前瞻性、战略性基础技术研究。其个人曾获第十九届求是杰出青年奖、浙江省有突出贡献中青年专家、浙江省科学技术进步一等奖、杭州市131中青年人才等多项荣誉;已申请发明专利90多件,获得授权发明专利11件,并在知名期刊、国际知名会议ICDAR、ICPR等发表多篇论文。

今年ILSVRC比赛为什么是这5部分,跟往年有何变化?

今年ILSVRC分为

任务目标检测(object detection)

目标分类与定位(object localization)

视频中的目标检测和跟踪(object detection / tracking from video)

场景分类(scene classification)

场景分割(scene parsing)

与去年相比今年增加了一项场景分割任务。这五类任务都是计算机视觉领域基础的人工智能任务,有广阔的工业应用前景。与去年相比,今年增加了一项场景分割任务。

简单介绍一下ILSVRC 2016五大部分的参赛规则?

鉴于这个参赛规则相对复杂,请参考ImageNet官网权威说明。http://image-net.org/challenges/LSVRC/2016,这是访问地址。

大致来说,五项任务提供了基础的训练集和测试集,各参赛队伍在训练集上训练,在测试集上完成测试,提交测试结果,然后,由组委会统一评估性能,并给出排名。