在摄像头无处不在的今天,为什么治安案件和刑事案件还是频繁发生?为什么大量案件还是很难侦破? 天网恢恢疏而不漏 的愿景什么时候才能真正实现?
人脸识别发展到今天,已然处于这个领域的黄金时期。
2012年底,Geoff Hinton的博士生Alex Krizhevsky、Ilya Sutskever采用深度学习的算法,在图片分类的竞赛ImageNet上,识别结果拿了第一名。这个标志性的事件直接改变了图像识别的发展轨迹,自此,深度学习开始席卷整个CV领域。
(从左到右依次为:Ilya Sutskever、Alex Krizhevsky、Geoffrey Hinton)
首当其冲的当属人脸识别。
深度学习的欣欣向荣直接推动了人脸识别技术的飞速发展,人脸识别一下子从刀耕火种的原始阶段进阶到了长风破浪的盛世王朝。很快,人眼的识别准确率就在标准测试集上败给了计算机。
很多公司都喜欢在各个测试集上刷榜,99%的识别准确率早已不是什么大新闻。现在没在某某测试集上刷个第一,都不好意思说自己是做人脸识别的公司了。
至此,在深度学习的加持下,人脸识别算法已经达到了它的鼎盛时期。
人脸识别的最终诉求莫过于确认身份,识别唯一的ID属性。除了远程开户、智能迎宾这种标准化的场景外,更大需求其实在安防监控。
根据最高人民检察院和最高人民法院关于刑事案件数量的统计,2015年全国人民法院新收刑事一审案件1126748件,同比上升8.29%。(数据来源:2001-2016年《中国法律年鉴》)
这只是一个参照数字,至于每年到底有多少刑事案件发生,具体数字无人知晓,这里面有多少案件得以侦破,我们也无从得知。但是,我们能看到,在摄像头无处不在的今天,还是有很多人肆无忌惮地进行违法犯罪活动。这其中一个很重要的原因就是,摄像头的数量虽多,但绝大部分情况下都拍不清人脸,犯罪分子存在侥幸心理,因而选择铤而走险。
为什么满大街1080P的高清摄像头,依旧拍不清人脸?
为了更直观地解释这个问题,我们做了一个小小的实验。
我们让几位同事分别站在距离一台高清1080P相机10米、20米、30米处,拍照后截取他们的脸部图片,发现他们脸部图片的像素分别只有36×36 pixel、18×18 pixel、12×12 pixel。