视图库——公安视频侦查数据处理应用中心

本文将着重对公安刑侦系统重要组成部分视图库的核心业务及技术架构进行分析阐述!

前言：作为公安刑侦研判的第一主要工具，视频监控在案件研判过程中发挥着越来越重要的作用，据统计，近50%的案件侦破与视频监控获取的资料有关。在视频数据成指数级增长的情况下，如何将数据采集、数据分析等处理环节变得精准高效成为公安视频侦查作战的前提，业内目前也已涌现出了针对视频数据合成作战系统的相关应用，比如视图库，本文将着重对公安刑侦系统重要组成部分视图库的核心业务及技术架构进行分析阐述!

文/尹鹏柳文凭

随着城市视频监控系统的不断完善和扩建，视频已经成为社会数据量最大的一类数据，网络甚至流传这样一个段子：电视台新闻行业应该给视频监控行业颁发最佳素材奖，原因是电视台播放的新闻中，有四分之一的素材来自于视频监控。当然这只是个段子，但无疑也再次验证了视频监控本身具备的新闻真实性、直观性等特色，这也是全国公共安全一直大力建设视频监控，把视频监控作为城市基础建设中一部分的一个原因。

发挥视频监控在案件研判中的效益

视频监控事实上已经成为公安刑侦研判的第一主要工具，协助公安系统维护社会的稳定。但是并不是说视频监控无懈可击。我们知道，随着平安城市的建设速度加快、996文把视频监控定义为城市基础建设设施的一部分，视频监控录像的体积走向了越来越庞大之路。

据最新的数据统计表明，视频监控的建设在已经存在2000万台的基础上依然按照每年20%的速度递增。视频监控录像已经超过百PB级别，朝EB级别迈进。公安干警通过视频监控侦破一个案件，平均需要调看6000G、3000个小时的录像的辛苦劳作。如何让视频监控在案件研判中越来越重要的作用下更好的发挥效率是现代视频监控行业一致认同的行业性难题。

庆幸的是，现在这个难题已经取得了一定突破性的进展了。在今年7月份由全国安全防范报警系统标准化技术委员会主导的GA/T1164-2014《公安视频图像信息联网与应用标准体系表》也就是行业内所俗称的视图库标准最新修订版正式发布。

视图库三大业务核心

视图库是什么?视图库是一个库，存下所有的结构化录像、超感信息;视图库是数据解析中心，能最快速度分析库里数据;视图库也是合成作战中心，能整合展现想要的信息。视图库是为了解决之前这一系列问题而诞生的，它具备数据搜集、数据分析、数据作战三个主要业务核心，利用数据的合成作战为案件侦破提供最关键线索服务，精确定位线索中的四要素：时间、地点、人物、事件。

数据搜集

其中数据搜集是整个视图库的重中之重，它包含了视图库最重要的核心-结构化，以及多维数据采集的超感。

为什么说结构化是重中之重?因为它是从占据EB级存储量的视频中提取数据的唯一方式。能够对每一个摄像机的监控画面其中的车、人信息进行最大化的结构化提取。一段几百兆的录像，提取后可以达到只有几百个字段再加上几K的图片的压缩比率。

而做到对每一个监控画面的分析，依赖的是对GPU集群计算的应用。GPU集群是能够实现1:1结构化的技术支撑。对比CPU，GPU的更多核心和其并行处理架构使GPU成为天然的图形计算系统。利用GPU做图形计算，我们可以做到比CPU计算：5倍以上性能提升，价格降低6倍，功耗降低10倍，体积减少20倍。利用依赖于GPU集群计算的1:1实时结构化，我们能够实现全数据中秒级响应的以图搜图。能够任意指定搜索车的车牌、车型、车款、颜色、遮阳板状态、前搁置物、前玻璃粘贴物。任意指定搜索人的年龄、性别、衣服颜色。

在数据搜集中另外一个重要的工具是用于多维身份判定的超感，身份识别精度随数据量和使用量增加，理论极限可达到万分之几的误差，结构化视频作为身份判定主参数毋庸置疑，现在的人脸对比能够达到99%以上的准确度。而超感的数据采集作为A类辅助信息其作用也极其重大。

通用的超感工具包分为，被动型和主动型两种，被动型以wifi sniffer为主，通过采集每个人都随身携带的手机网卡MAC地址，去定位人员。主动型以RFID感知为主，通过对需要管控的人或者物加载有源标签，可实现精确管控。

其中被动感知的wifi sniffer 功能，可以通过小小大大的反复型线索确认方法提高线索搜索效率。比如我们可以通过几个摄像机视频确定一个人员的小范围视频轨迹，通过这个视频轨迹与周边MAC采集数据进行轨迹碰撞，碰撞出最可能的几条MAC轨迹后，可以快速对这几个MAC轨迹进行大范围搜索，得到一个更大的MAC轨迹，然后再通过这个辅助MAC轨迹去碰撞视频监控录像，精准、快速调取录像内容，最终得到切实的人员视频轨迹。这就是小小大大的线索确认方式，它提高了监控录像调取效率，降低了公安干警视频研判的工作量。

RFID作为主动型感知建设功能，其具备切实准确的数据结果。可以用做于精确管控，比如电动车进行管控，主要功能包括：提高治安案件主要作案工具的管控，降低猖獗的电动车偷盗相关案件发生率，规范电动车超速驾驶，杜绝电动车肇事逃逸。

数据分析

视图库的第二大核心业务：数据分析，是公安大数据建设的重要部分，它的准确度和分析速度直接影响了整个系统的运行效率。

为了提高数据的准确度，最新的视图库技术大范围使用了人工智能领域的技术桂冠深度学习算法，它能够让机器自动训练，速度提升十倍。全特征训练，算法扩展速度提升三倍。现在的人脸识别精度达到99%以上，依赖的也就是深度学习算法。利用深度学习的宇视人脸识别系统，能够实现人脸识别的超难度工作，无论你做鬼脸、胖了、老了、挡脸、挡嘴、侧脸都可以准确的识别出你的存在。

解决了准确度问题，最新的视图库技术利用新一代的时空数据库去解决速度的问题。时空数据库是针对安防特性提出的一个专业安防数据库概念。其开发依据公安部研究所的研究报告：只要有4个时间点和位置的数据，就能确定一个人身份。依据此研究成果，以时间为线，以地点为轴对结构化信息进行分类的时空数据库，能够更容易、更快速的对视频内容进行规则分析，找到线索轨迹。

时空数据库中充分整合了两个最重要的大数据框架Hadoop和Spark。Hadoop作为模式计算的典范，能够做到营房中算无遗策，它最大特性是能够对历史数据进行有组织的存储和计算。属于战略层计算，只针对历史数据，能够做到以史观之，可看历史规律、找未来趋势,独独缺乏对现状的分析，这就依赖另一个大数据框架，着重进行流式计算的Spark，它做到的是运动中歼敌，属于战术层计算，主要特征依赖于内存计算，针对动态数据，速度奇快，适合追踪、布控。

数据作战

视图库的第三大核心业务：数据作战，是视图库在用户面前最直接呈现，是数据展示效果的依托，没有数据作战模块的展现，再多的数据、再快的分析皆是无用之物。而这些数据都应该整合在具备时空关系天然展现的电子地图上，让数据一目了然。电子地图支持直接信息类展现，包括设备类：枪机、云台、球机、超感基站、立杆等基础设备;警力类：警员、警车、岗亭等警力信息;报警类：110报警、报警岗亭、布控报警等信息;支持数据分析类地图展现：包括轨迹类，车辆轨迹、RFID轨迹、MAC轨迹;案件分析类，案件轨迹、案件视频、案件图片;数据结果类，案件热力图、摄像机密度图。

(本文作者尹鹏现任职于天津市公安局和平分局、作者柳文凭现任浙江宇视科技有限公司解决方案架构师、)