以人為中心的數據收斂和智能研判——視頻數據為警務研判帶來的飛躍
公安機關性質與任務決定了中心工作都是圍繞人來開展,“人”是案件或者事件的主體。案件發生后,公安機關首先需要研判的“誰”是作案嫌疑人,而“誰”需要“ID”來唯一標識。在日常生活工作中, “姓名”可以來唯一指向一個對象,但是“姓名”ID標識因重名存在缺陷。警務工作中,常用的ID更為廣泛,筆者認為大致可以分為三類:第一類是人體生物特征,比如指紋、虹膜、DNA等;第二類是主體人經常使用的,比如身份證號碼、手機號碼等;第三類是互聯網的虛擬身份,包括微信、QQ、支付寶、抖音等各種APP的賬號。不同的ID有不同的優劣勢,比如第一類相對準確真實,但是采集困難;第二類最普及,但是偽裝性強;第三類為新型ID,隨著互聯網特別是移動互聯網的興起,警務工作能夠采集的線索(含ID)也急速擴張,特別是在APP需要手機號碼唯一注冊后,與主體“人”的關聯性在逐步增強。APP里的內容也隱藏了大量的線索,比如微信的聊天記錄可能透露嫌疑人的位置,抖音的視頻獲取嫌疑人的頭像等等。出于數據安全考慮,互聯網APP的虛擬身份和內容一般都經過了加密處理。
通過ID唯一指向嫌疑人,然后圍繞ID,依托人事物、地點組織、關系、生物特征、電子軌跡、活動軌跡等多維數據,對嫌疑人展開靜態屬性、動態屬性、規律屬性等“屬性分析”,以得知嫌疑人住在哪里,去了什么地方,甚至預測嫌疑人將要去什么地方,會有什么動作等,發揮大數據最核心的價值——預警預判,真正實現情報主導警務。如下圖所示:
公安內網的業務數據(如車管所數據、人口庫數據等)采集的是人的靜態屬性,得知“對象是誰”;物聯網中的視頻數據(以及互聯網數據)采集的主要是人的動態屬性,得知“對象在哪”。可通過多維數據時間和空間上的疊加構建算法模型,得知“對象規律”。
傳統警務大數據的特點是準確性和豐富性,那么視頻大數據的特點是真實性和可視化。傳統警務大數據省級體量往往在1PB左右,數據種類多至上百種。數據準確高;而視頻數據的采集往往是在群眾不被告知的情況下被動采集,所以數據往往真實性高,但是因為受限于算法精度、安裝環境等因素,視頻數據的準確性不高。比如,同一款人臉智能攝像機,安裝的合理,捕獲和識別率可以到95%以上,不合理,則可能到不了50%。
可視化是視頻數據的另一個特點。公安機關特別是基層民警在警務工作中,經常需要調閱視頻,因為視頻記錄還原了那一刻“最真實的事實”,而且最直觀。但是非結構化的視頻是不能用于大數據分析挖掘的,需要經過智能視頻算法提取視頻中的結構化內容,包括人車對象、異常行為等;視頻數據種類相對比較少,導致在視頻結構化變成數據過程中,損失了大量的價值信息,比如案發當天下暴雨(室外),步態異常(室內)等。所以目前,原始視頻必須被按一定期限保留,保留價值最全的數據載體。
視頻對象結構化數據根據價值梯度分為三個圈,如下圖所示。第一個圈內的數據(車牌號碼、人臉模型、車輛模型、人體模型)具有ID屬性,價值最高;第二個圈內的數據(人臉屬性、車輛屬性等)不具有ID唯一指向對象的屬性,價值相對較低,但是具有縮小嫌疑對象范圍的能力;第三個圈內的數據是系統穩定可靠運行的支撐。
第一個圈內的數據價值最大,但是具有不同的優勢特點。從易讀性、準確性等維度對比如下(附加移動終端特征和RFID):
ID屬性對比 人臉模型 人體模型 車牌號碼 車輛模型 移動終端特征 RFID
(人眼)易讀性 弱 弱 強 弱 弱 強
(ID)準確性 中 弱 強 中 強 強
(場景)豐富度 弱 強 強 強 強 強
(與人)匹配度 強 弱 弱 弱 弱 中
(ID)偽裝力 強 弱 強 弱 強 弱
(ID)易損性 弱 弱 強 弱 弱 強
(人眼)易讀性:模型數據作為半結構化數據,無法用人類語言表述出來,導致民警無法進行口語描述和文字傳遞(比如全文檢索),而車牌號碼就可以由案發現場的A民警告知辦案中心的B民警,再由B民警將車牌號碼錄入布控中心,發起全城布控,此業務場景就是ID易讀性帶來的優勢。
(ID)準確性:受限于算法精度和安裝環境等因素限制,模型數據的識別率通常不高,而人體模型因為ID特征點不明顯,建模困難,企業研發投入相對不足等原因,準確率相比車牌號碼低很多,而且不穩定。
(場景)豐富度:目前,攝像頭的布建,越來越依托業務場景,即有目的性
的去采集視頻中的對象和行為,所以兩者(場景和對象ID)耦合度不斷增強。比如人臉對象的采集:因為算法對人臉像素和人臉角度的要求比較高,所以適合安裝人臉智能IPC的場景并不多,局限于狹長式的人員通道、規則的人員出入口等。但是捕獲人體的場景就相對豐富,大部分室外開放式的場景都合適,對人臉像素和人臉角度基本無要求。結合(ID)準確性這項,可以得知人體模型是弱ID,但是場景豐富,適合采集對象人的軌跡。
(與人)匹配度:本文一開始提到警務工作是圍繞“人”為中心展開的,所以不同的ID最終是需要關聯到“人”,因為“人臉模型”是直接采集的人身上自帶的ID,所以和主體“人”的匹配度最高,采集人臉圖像建模后和公安內網的人口庫作比對實現身份確認。對于車輛對象,因為特定時間的司機不一定是車主(車主信息可以由公安內網車管所獲得),所以車牌號碼和車輛模型兩個ID和“人”的匹配度是相對低的,特別是真實的案件中,嫌疑人往往不會使用自己名下登記的車輛。
(ID)偽裝力:真實案件中,嫌疑人經常會帶上口罩,嫌疑車的車牌號碼被遮擋污損或者直接套牌無牌等,容易偽裝。但是對于人體模型和車輛模型兩個ID,一方面難以偽裝,另一方面目前的作案人員還沒有這個意識去針對這兩種ID進行偽裝,所以偽裝力弱,已采集。
(ID)易損性:人臉、人體、車輛等模型數據,因為直接附著在對象身上,所以嫌疑對象不會自己主動發起破壞,比如把自己的臉刮傷,把車給砸壞等,基本不太可能。但是比如車牌號碼、或者RFID等電子標簽,因為成本低,相對容易被故意損耗和破壞。
綜上可以看出,不同的視頻類ID具有不同的優劣勢,如果在警務實戰過程中將不同ID的優勢進行互補,強強結合,將發揮出1+1>2的實戰價值,這也是大數據戰略中非常關鍵的一環。
應用場景:(1)調取現場視頻監控,鎖定嫌疑人;(2)結構化大量視頻,提取人體模型,對嫌疑人構建豐富的軌跡;(3)利用軌跡中多維智能抓拍機同時捕獲清晰正面人臉和人體,將人臉模型和人體模型進行關聯,人臉模型和公安業務人口庫比對確認嫌疑人身份和登記住處;(4)通過人體模型形成的軌跡,分析嫌疑人的落腳點,和登記的住處相吻合,最終捕獲嫌疑人。案例偵破中,結合利用了人臉模型(與人)匹配度高和人體模型的(場景)豐富度高兩個不同的優勢,通過人臉模型知道“是誰”,通過人體模型知道“在哪”。
未來,隨著越來越多的數據匯聚到大數據池中,通過“數據拼圖”,構建“數據魔方”,形成能力倍增器,為各警種提供易懂、可視、高度共享的價值鏈。
本文來源:《企業科技與發展》:http://www.007hgw.com/w/qk/21223.html
- 2025年中科院分區表已公布!Scientific Reports降至三區
- 2023JCR影響因子正式公布!
- 國內核心期刊分級情況概覽及說明!本篇適用人群:需要發南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發布,論文寫作規則發生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規則
- 盤點那些評職稱超管用的資源,1,3和5已經“絕種”了
- 職稱話題| 為什么黨校更認可省市級黨報?是否有什么說據?還有哪些機構認可黨報?
- 《農業經濟》論文投稿解析,難度指數四顆星,附好發選題!