安防市場(chǎng)的快速增長(zhǎng),給視頻監(jiān)控技術(shù)提出了新的需求,促使視頻監(jiān)控技術(shù)從“高清化”往“智能化”發(fā)展,究其原因,既有技術(shù)因素(數(shù)據(jù)、算力和算法)的驅(qū)動(dòng),又和國(guó)內(nèi)的政策引導(dǎo)息息相關(guān)。
海量數(shù)據(jù)成優(yōu)質(zhì)訓(xùn)練場(chǎng)
數(shù)據(jù)是人工智能的原材料,沒(méi)有原材料就好比“巧婦難為無(wú)米之炊”。人工智能是非常消耗大數(shù)據(jù)儲(chǔ)備的“監(jiān)督性學(xué)習(xí)場(chǎng)景”,要有足夠多的量才能滿足訓(xùn)練數(shù)據(jù)的需求。
視頻監(jiān)控高清化進(jìn)程使得圖像分辨率從D1發(fā)展到 720P、1080P 再到 4K,同時(shí)市場(chǎng)上高清攝像頭的比例也在擴(kuò)大,每日產(chǎn)生的視頻監(jiān)控錄像的數(shù)據(jù)量就可達(dá)到上千PB,累積的歷史數(shù)據(jù)就更為龐大了,而且其中99%以上都是非結(jié)構(gòu)化數(shù)據(jù)。
這些海量的數(shù)據(jù)一方面為視頻監(jiān)控人工智能化的數(shù)據(jù)訓(xùn)練工作提供優(yōu)質(zhì)的資源;另一方面,面對(duì)如此巨大的數(shù)據(jù)量,如果再采用過(guò)去簡(jiǎn)單的人海戰(zhàn)術(shù)進(jìn)行檢索和分析,已經(jīng)很難滿足新時(shí)代的安防工作需求。在此情況下,智能安防成為解決問(wèn)題的唯一途徑,也就是要通過(guò)將非結(jié)構(gòu)化的圖像信息轉(zhuǎn)換為計(jì)算機(jī)能夠理解的結(jié)構(gòu)化數(shù)據(jù),并利用人工智能技術(shù),實(shí)時(shí)分析視頻內(nèi)容,將這些海量的視頻數(shù)據(jù)轉(zhuǎn)化為有效的數(shù)據(jù),以提高監(jiān)控系統(tǒng)效率。
深度學(xué)習(xí)日漸成熟
在人類有史以來(lái)積累的大數(shù)據(jù)中,85%以上是視頻和圖像數(shù)據(jù),因此人工智能的核心之一是視覺(jué)智能。而深度學(xué)習(xí)算法的應(yīng)用,使得計(jì)算機(jī)視覺(jué)技術(shù)得到了突破性的發(fā)展,從而也突破了視頻監(jiān)控的許多應(yīng)用限制,使其應(yīng)用范圍日益廣泛。
在深度學(xué)習(xí)算法成熟之前,傳統(tǒng)的計(jì)算機(jī)視覺(jué)算 法主要采用特征識(shí)別的方法,通過(guò)人工定義的特征參 量來(lái)對(duì)圖像進(jìn)行分類和識(shí)別。當(dāng)需要區(qū)分的圖像類別增加,或者圖像的內(nèi)容更加復(fù)雜時(shí),特征識(shí)別方法需要 引入大量的參數(shù),并且需要對(duì)模型不斷地進(jìn)行微調(diào),其 實(shí)現(xiàn)難度急劇增長(zhǎng),因此這種方法的識(shí)別效率和準(zhǔn)確度都存在瓶頸。在實(shí)際應(yīng)用中,傳統(tǒng)的特征識(shí)別方法可以實(shí)現(xiàn)諸如交通卡口的車牌號(hào)識(shí)別、入侵檢測(cè)、逆行檢測(cè)等簡(jiǎn)單功能,但是在人臉識(shí)別、行為識(shí)別等領(lǐng)域一直沒(méi)有形成有效的解決方案。
深度學(xué)習(xí)算法通過(guò)設(shè)置多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),讓算法自行尋找和調(diào)節(jié)中間參量來(lái)進(jìn)行大規(guī)模訓(xùn)練。自2006年以來(lái),深度學(xué)習(xí)算法取得了重大突破,在隨后的10多年里,憑借互聯(lián)網(wǎng)發(fā)展帶來(lái)的大數(shù)據(jù)資源、算力的快速提升、巨頭公司的基礎(chǔ)框架開(kāi)源等有利因素,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)算法性能也快速提升。在ILSVRC圖像分類比賽中,2012年的深度學(xué)習(xí)算法將識(shí)別錯(cuò)誤率降到 15.3%,2015 年微軟更是將識(shí)別錯(cuò)誤率降到3.6%,已經(jīng)超過(guò)了人類5.1%的識(shí)別水平。在人臉識(shí)
別領(lǐng)域,深度學(xué)習(xí)算法在 LFW 競(jìng)賽中已經(jīng)達(dá)到了99.83%的識(shí)別水平,也超過(guò)了人類99.2%的識(shí)別水平。因此,深度學(xué)習(xí)算法的成熟為計(jì)算機(jī)視覺(jué)領(lǐng)域帶來(lái)了革命性的進(jìn)展,在安防領(lǐng)域利用計(jì)算機(jī)視覺(jué)來(lái)實(shí)現(xiàn)人工智能已經(jīng)具備了先決條件。目前,人臉識(shí)別、車輛識(shí)別、行為識(shí)別等功能已經(jīng)突破應(yīng)用門檻,實(shí)際的應(yīng)用場(chǎng)景和應(yīng)用方案也都在不斷擴(kuò)展。
算力承載大幅提升
1999年,英偉達(dá)首次推出GPU架構(gòu)。相比CPU,GPU 擁有大量的邏輯單元,更擅長(zhǎng)處理海量數(shù)據(jù),因而被應(yīng)用到深度學(xué)習(xí)領(lǐng)域中。2006年,英偉達(dá)又推出CUDA編程工具包,CUDA框架使得GPU可以通過(guò)更簡(jiǎn)單、有效的接口和開(kāi)發(fā)者進(jìn)行交互,使得開(kāi)發(fā)者可以充分利用 GPU 的運(yùn)算資源,進(jìn)一步提升 GPU 架構(gòu)的性能。
從目前的實(shí)際應(yīng)用來(lái)看,安防領(lǐng)域的數(shù)據(jù)是以圖像視覺(jué)數(shù)據(jù)為主,其數(shù)據(jù)量大,并且數(shù)據(jù)層次非常復(fù)雜,因此能夠充分發(fā)揮GPU圖像處理以及高性能計(jì)算的特點(diǎn)。GPU作為專為圖像處理設(shè)計(jì)的處理器,能3D模型的信息轉(zhuǎn)換為2D數(shù)據(jù),即實(shí)現(xiàn)視頻圖像的結(jié)構(gòu)化處理;而且,隨著 GPU 的快速發(fā)展,在浮點(diǎn)運(yùn)算、并行計(jì)算等部分,GPU可以提供數(shù)十倍乃至上百倍于CPU 的性能,相比 CPU,GPU 能將程序運(yùn)行的時(shí)間從幾周降低到一天。所以說(shuō),算力的成熟使得深度學(xué)習(xí)強(qiáng)大的數(shù)據(jù)表達(dá)能力得以體現(xiàn)。
政策東風(fēng)加碼
政策層面,國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出了面向 2030 年我國(guó)新一代人工智能發(fā)展的總體要求、重點(diǎn)任務(wù)、資源配置、保障措施等。智能安防會(huì)作為人工智能產(chǎn)品創(chuàng)新的重點(diǎn)應(yīng)用推廣領(lǐng)域,實(shí)施智能安防推廣工程,鼓勵(lì)安防企業(yè)與互聯(lián)網(wǎng)企業(yè)開(kāi)展合作,研發(fā)集成圖像與視頻精準(zhǔn)識(shí)別、生物特征識(shí)別、編碼識(shí)別等多種技術(shù)的智能安防產(chǎn)品,推動(dòng)安防產(chǎn)品的智能化、集約化、網(wǎng)絡(luò)化。
在國(guó)家政策的支持下,“感知互聯(lián)、數(shù)據(jù)驅(qū)動(dòng)、云端共享、智慧應(yīng)用”將是未來(lái)安防行業(yè)的發(fā)展方向,物聯(lián)網(wǎng)、大數(shù)據(jù)、視頻結(jié)構(gòu)化、生物識(shí)別及人工智能等技術(shù)將融入到安防行業(yè)整體解決方案中,推動(dòng)國(guó)內(nèi)安防智能化的快速發(fā)展。
原標(biāo)題:為何說(shuō)視頻監(jiān)控行業(yè)智能化已時(shí)機(jī)成熟?
昵稱 驗(yàn)證碼 請(qǐng)輸入正確驗(yàn)證碼
所有評(píng)論僅代表網(wǎng)友意見(jiàn),與本站立場(chǎng)無(wú)關(guān)