第79章 AI演算法課(1 / 1)

加入書籤

刑斌和剛子都兩眼通紅髮澀,看錄影是現代刑偵的一門必需技術手段,但也是一項體能和意志煎熬的工作。

一整夜努力,找出了三個適合的人選。

刑斌跟小衛要了眼藥水,倆人都躺平在椅子上滴眼睛。

“你說我們會不會漏掉監控沒有複製,一晚上就整了這麼三個人出來,感覺跟昨天我們的分類產品一樣,木有啥期望啊。”剛子道。

“要不然了,我們複製的只是其中六分之一不到的攝像頭錄影,全複製回來,這一週都耗這上面,也不見得能多幾個人出來,這是幾條必經路線,如果沒有我估計是真的沒有,完美避開,現在我心裡就一上一下的有點慌。”

刑斌所言不假,如果這三個人都排除掉,昨天這場大範圍大規模的行動,大機率是雷聲大雨點小了。

“假如現代人工智慧的技術突飛猛進,是不是能讓計算機代替我們完成這事兒?就是說,有這麼一套軟體系統,我給出目標畫像,不光是人還有車牌等等,再給出影片原始檔,然後由計算機自動給我們作對比,我們就喝著茶吃著瓜,然後叮一聲結果就出來了。”

剛子眨巴眨巴眼睛,刺眼的燈光讓他不得不又閉上。

“理論上是可以的,其實這個我是真的思考過,需要建模型。影片是由一幀一幀的影象構成,精度越高,每秒的幀數越多。普通的監控一秒25幀,也就是一秒拍了25張像,一個小時9萬張。其實我們肉眼掃描跟計算機掃描本質是不一樣的,肉眼是憑藉對幾何圖形的直觀感覺,計算機則不一樣。”

刑斌起身在白板上寫下幾點:

1.影象縮放到一定大小

2.轉化為灰階

3.計算所有畫素平均值

4.比較畫素的灰度:將每個畫素的灰度,與平均值進行比較,大於或等於平均值記為1,小於平均值記為0;

5.計算雜湊值:將上一步的比較結果,組合在一起,就構成了一個64位的整數。

“就是說每一張圖片都有大小轉換後畫素化再取值的一個過程,這是一個很大的運算量。比如,我們給定條件:揹包、帽子背影或側面,這是一個很模糊的概念。計算機做對比,首先需要一張底圖,那這張底圖應該是什麼樣子呢,我和你揹包、戴帽背影應該差不多,小安跟我們有區別,前天晚上見到的老洗跟我們有區別。包的形狀帽子的形狀,幾個因素的綜合,需要建一個底圖模型庫。比較範圍也不是整個人全部,是從頭部到腰以上,因為揹包長度正常不會過腰。然後才是影片裡的每一幀圖片,每獲取一幀就與底相簿做一次比較,大約是這麼一種模式。如果我們的底相簿是100張,一個小時的影片,需要比對900萬次,我們複製的錄影時長10個小時,自己算,這還是一個攝像頭。”

剛子吐了吐舌頭,“聽著有點嚇人。”

小安也來了興趣,“現在的人臉識別技術不是已經很成熟了嗎?一些辦公大廈、高鐵站,刷臉就能通行。”

“沒錯,但本質概念還是一樣的。高鐵站刷臉,是用你真實的人臉和身份證上的人臉作對比,一共就兩張圖,以身份證照片作為底圖。而且有效的人臉範圍只需要雙眼到下巴這個區間,眼睛以上和下巴以下都是無用資料,用證件照去和抓拍的人臉進行比對,這個對比資料量其實很小,結果都是秒出。”

“是啊,坐高鐵進站的都是臉對著攝像頭一刷就行,最多一秒。”剛子道。

“那只是整個過程,實際不需要一秒,對比結果還要通知感測器,感測器發出開閘指令,整體過程大概一秒。”

“那我們現在的難度在哪裡。”小安道。

“第一我們沒有原型,不過原型庫容易建,就是揹包和帽子,找一些體型身高不同的人穿戴起來,拍下正面和側面,這個量不會大,效率高人齊兩小時就弄完,難點是第二。”

不知不覺間,好幾個事同事都豎起耳朵聽著刑斌講解。

“繼續繼續,別停下來。”小安顯得尤為感興趣。

“我們做的不是靜態分析,而是一種動態的行為分析。”

刑斌索性站到白板邊,寫下:行為分析,從校外進入往另一邊的圍牆走。

“假定一段錄影從頭開始播,先要對比到進入畫面的某個人揹包戴帽的特徵,這一幀影象的資料算是符合,確定一個原型,這個原型不是底相簿的原型,動態的用完就刪除。然後要分析是男還是女,一個人的正臉照,在計算機演算法裡可以識別性別,但側臉就不清楚,估計不行,但女性需要過濾掉,然後一直到這個原型消失,這算一次行為。”

“懂了,出現和消失,這算一次行為。”剛子道。

“別打岔。”小安拍拍剛子。

“對的,出現和消失。那什麼叫做消失,我們肉眼看是這個人走進了攝像頭的死角或者是走出了拍攝範圍,不再出現就算消失。但對計算機資料來講就有點模糊,電腦只認0和1,看得見存在看不見消失,按這個邏輯就會產生很多誤判。”

“為什麼了。”小安比較急切。

“如果一個人蹲下來綁鞋帶,剛好被植物擋住,算不算消失了?按照0和1的邏輯,肯定算消失,但肯定不對。人可以透過快進往前繼續看一段,計算機不能這麼做,必須一幀一幀的對比,否則就沒有意義對吧。”

周圍的同事都點頭同意。

“可這個人只是蹲下綁鞋帶,實際上沒有消失,這與我們設定的行為分析不一致。我們選定的攝像頭是在路線上有連續性的,往一個方向過去,A處消失理論上應該在B處出現,如果他沒出現,肯定是往其他方向走了。其他方向也一樣,只要是向校區後面圍牆走,都有連續攝像頭,還是應該在我們設定的行為範圍內。不過作為一個急於去現場作案的人來講,不會這樣遛彎,他選擇這種方式去案發現場,就是為了避開人,儘量少見到人。”

“那應該怎麼處理了。”小安道。

“可以做一個意外消失的閾值作為補缺,這個閾值是一個時間,可以延時5秒、10秒、20秒,時長可以自己定。也就是在一個人消失後,計算機自動往後讀取閾值範圍內的影象幀,如果閾值範圍內人還沒有出現才算消失。”

“那這樣其實可以解決這個問題。”剛子道。

“看似可以,其實還是存在問題。每個人的行為不一樣,就像我說的剛才綁鞋帶,這沒有一個ISO標準,有人快5秒綁好,有人慢20秒才綁好。再或者,這個人他不是綁鞋帶,他剛好有個電話進來,他就蹲在路上聽電話,這個場景我們前晚從校園出來時見過。”

刑斌看看剛子,剛子點點頭。

“怎麼還有這種嗜好,蹲著舒服嗎?”小安又插了一句。

“個人習慣吧,但這裡產生的問題是:這個閾值應該設多大才合適。設小了,可能會漏掉了捕捉疑犯的機會,設大了,那非常浪費計算機的計算資源和時間。”

剛子舉起手錶示要發言,“如果這個人接電話的時候,不是蹲著,就站著不動,但是打電話時的姿態跟他揹包行走的姿態完全不一樣了,還能判定是同一個人嗎?”

“這一點倒沒任何問題,之前講過,從頭部到腰部這個範圍,不包括雙手,他就是拿著大刀也不影響計算機的邏輯分析。”

“電腦就是個死物,浪費就浪費唄,只要保證結果正確率就行。”小安道。

“系統設計可不是這麼考慮的,尤其商業應用系統,時間和計算資源都是成本。即使加大閾值,確定了這個人行為,那他一定是我們要找的人嗎?可不一定,這只是一個攝像頭的資料,我們的行為設定是要走到牆邊,他可以在中途走進教學樓,也可以走進圖書館,還可以走進教工宿舍區等等,所以必須一直比對到最後一個攝像頭。”

刑斌喝口水繼續,“首先,這個資料量和計算量相較普通的人臉識別不可同日而語,一個天量一個地量。其次,原則上來講,我們從行為確定了一個人,雖然只是背影,但我們想不想看到他的正臉了,一定想。怎麼看到,不是用我們的眼睛,是計算機自動為我們找出來,透過揹包形狀,帽子的形狀,人的側臉,背影,這又是一個模糊演算法。而且光從第一份錄影資料中人的背影,是很難分析他從哪個方向進入,如果只是華山一條路那當然好辦,但真實場景是不可能的,因為他很可能不是走大門進入,而是翻牆。所以必需把每個方向都考慮到,資料量和計算量立即成幾何級數的增加。再次,一個晚上怕不會只有一個人揹包走過,所以N乘以N真的是海量計算。當然,我不是演算法工程師,專業的工程師可能會有更優的思路和演算法邏輯,但資料量是擺在這兒的,因為我們是根據模糊的條件去確定一個模糊的人。不過如果真有這樣技術對我們幫助一定很大,電腦又不知道累也不會飢餓,撐死宕機,人可是會掛掉的。”

刑斌的話音剛落,全辦公室的人熱烈地鼓起掌來。

↑返回頂部↑

書頁/目錄