求多且求精 准确率是大数据应用的首要难关

科达告诉你,公安大数据应用的构建方式与难点,及公安大数据应用的市场竞争点。

公安行业一直是安防技术应用的前沿市场,在安防领域,目前对于公安大数据的应用方式,可以分为以下三个层次:

1、统计查询:这是对大数据最基本的应用方式,主要面向历史与现状,回答已经发生了什么事情,如流动人口分区域统计、实有车辆归属地统计、各类案件的数量分布和趋势。

2、数据挖掘:是目前大数据的核心应用方式,其重点不在于发现因果,而是发现数据之间的关联关系。这种关系可能可以直观解释,也可能不能马上发现其中的深层次原因,但对工作具有一定指导意义,比如季节气候与某些类型案件的关联关系、车辆活动范围、活动习惯与黑车的关联关系。

3、预测预判:是大数据应用未来的发展方向,在数据统计、分析、挖掘的基础上,建立起合适的数据模型,从数据的关联关系入手,推导出因果关系,能够对一定时期内的趋势走向做出预测,对危险信号做出预警,指导预防工作的走向。

这三个层次具体到实际业务系统,包括图侦、车辆特征分析系统、人员特征分析系统、视频侦查系统等等。这些系统以普通视频监控、车辆/人员卡口、智能IPC等监控前端获取的视频、图片、结构化描述为基础,通过大数据平台的智能分析,实现如以图搜图、语义搜图、车辆/人员布控、疑似案件对比、详细特征分析等等深度大数据应用,帮助公安能够快速、科学地侦破案件。

公安大数据应用于不同警种,由于其实际应用需求的区别,解决的问题也有所区别。如智能交通领域,目前大数据主要应用于车辆的疏导,比如基于不同道路、路口车流量的统计(时、日、月统计等),根据这些统计可以分析不同时段某条道路实时的车流密度、发展方向和趋势等。这些应用目前已在很多大城市落地,比如平时大家在公交上看到移动电视里播放的上下班高峰路段实时画面,就是基于大数据的技术分析所得。

公安大数据应用的构建方式与难点

以车辆分析系统为例,介绍如何在平安城市大数据平台上构建应用:

1、数据的来源与构成

基于大数据平台的车辆分析系统,其数据可分为静态数据与动态数据。静态数据主要来源于车驾管库、盗抢库、布控车辆库、涉案车辆库等公安业务系统的资源情报类数据库,这些数据构成了车辆数据仓库的核心库。动态数据主要是来源于卡口联网平台,其数据可分为结构化的卡口通行数据与非结构化的卡口过车图片,这些数据随着时间的推移而不断增长,构成了车辆数据仓库的中心库。来自于其他设备如枪机、球机等视频监控设备抓拍或截取的车辆图片,来自于系统外的车辆图片,构成了车辆数据仓库的外围库。

2、数据的存储

对于核心库的车辆静态数据,通常都是存储于关系型数据库中。对于中心库的卡口通行数据,则存放在面向列的高可靠高性能分布式数据库HBase中,其中实时过车记录部分,因其查询量大且更新速度快,放置在内存中以优化吞吐量,降低系统I/O负荷。外围库的车辆图片数据,则存储在类似于IPSAN这样的普通存储空间内。

3、数据的结构化与搜索查询

对于卡口过车图片这样的海量非结构化数据而言,为了实现数据的检索,必须通过智能分析技术对其进行结构化并入库,从卡口图片中提取出车牌颜色、车身颜色、车标、细分车型等传统卡口前端不能提供的结构化信息并存储在HBase中。
1 2 阅读全文