3D 獨特的技術優勢或許能賦予安防新機遇
未來安防智能化落地的三大方向:視頻結構化、生物識別技術、物體識別技術。
視頻結構化對數據進行追蹤和關聯的分析,從而做到事前預警;生物識別技術中的人臉、指紋、虹膜、聲紋識別將得到大規模應用;物體識別技術減輕各種成本,提升效率。
針對未來安防智能化落地方向,奧比中光高級戰略 BD 總監彭勛祿做客雷鋒網公開課,闡述了奧比中光的思考,并詳述了奧比中光關于 3D 視覺在智能安防領域應用落地的實踐與探索。彭勛祿提到,安防產業每一階段的突破,都是由上游技術的革新引領,“看得到、看得遠、看得清、看得懂”四大要素也成為推動安防行業進步的主要驅動力。
其中,感知作為 AI 三個階段之一,是實現智能化認知和決策的必經階段。未來安防智能化,要實現“看得懂”這一目標,不僅僅需要依靠 AI 算法和 AI 芯片,還需著力提升圖像視頻類感知的深度和緯度。同時,AI 技術對視頻成像的高要求成為安防智能化的痛點之一。而 3D 將在主動光技術、空間三維數據、背景分離等方面帶來革新,其獨特的技術優勢或許能賦予安防新機遇。
以下為彭勛祿分享內容節選,雷鋒網 AI 掘金志做了不改變原意的編輯。
安防行業發展經過了幾個重要階段。1979 到 1983 年,安防行業形成以模擬攝像機+視頻矩陣+磁帶錄像機為產品矩陣的模擬階段;編解碼技術的出現實現了從模擬階段到數字階段的轉化,而數字化是網絡化和智能化的前提;1997 年網絡攝像機的出現打破了傳統安防地域的邊界,安防行業通過網絡全面升級、傳感器芯片性能的提升和網絡基礎設施的高速發展而步入高清 / 超清時代;2012 年以后,國內互聯網公司涌入安防行業,人工智能技術進入快速落地階段,至此,安防行業進入智能化時代。由此可見,安防產業每一個階段的突破,都是由上游技術帶來的革新引領;另外“看得到、看得遠、看得清、看得懂”這四大要素,成為推動安防行業進步的主要驅動力。
安防行業宏觀環境
智能安防的發展環境非常有利。
首先國家政策大力支持,十三五規劃、十九大報告等政策均在不斷強調數字城市、智慧城市、智慧安防監控系統的建設。
從市場潛力看,目前一二線城市的安防基礎設施布局已經日趨完善,未來會以更新升級為主。主力的安防市場會逐漸向二三四線城市下沉。
從技術看,AI 技術從 2012 年進入安防行業,經過多年的發展,已經進入實戰化階段,人臉識別等 AI 技術在公安抓逃、社區治理等場景中發揮了巨大作用。
從行業研發投入上,國內安防廠商對 AI 技術投入逐漸加大,尤其是安防賽道中的頭部企業,在 AI 技術與產品的研發投入占比極高。
另外,新晉的 CV 獨角獸與互聯網巨頭企業紛紛進入到安防主賽道,加劇行業競爭。但安防不同于互聯網行業,它涉及諸多層面,包括硬件、軟件、系統集成,以及工程與運營,還有渠道建設,這些都需要時間積累與沉淀。
所以我認為,CV 公司和互聯網公司雖然能夠利用各自優勢觸達行業、進入到賽道,但他們同樣也面臨傳統安防巨頭的擠壓與競爭。
今年爆發的新冠疫情,對整個城市的安防及應急指揮系統提出極大的挑戰,同時也是前所未有的發展機遇。
從安防行業業務需求看,會出現從事后查證向事前預警前移的需求變化。
我認為安防智能化的一個重要出發點,就是從事后查證向事前預警前移。傳統安防監而不控,更多是強調安防系統的覆蓋面,監控不能有盲點,不能有死角,它只解決“看得到”和”看得清”的問題;而到了安防 2.0 時代,安防系統還需要”看得懂”,實現這一目標,不能僅僅依靠 AI 算法和 AI 芯片,還需要著力提升圖像視頻類感知數據的深度和維度。
另外,AI 技術融入安防全產業鏈,上中下游均出現明顯的技術革新趨勢。
傳統安防產業,上游的圖像傳感器供應商,包括芯片和其他電子元器件供應商,負責提供技術給中游的硬件供應商、軟件供應商以及系統集成商,下游以運營服務商為主,為終端客戶提供服務。
AI 技術融入安防行業中有一個非常有趣的現象:CV 公司開始做芯片,原來傳統上游芯片公司都在做 AI 算法。
因為通用型的芯片無法滿足垂直場景下的市場需求,所以 AI 算法必須和芯片結合。這并非簡單的整合,要考慮諸多因素,包括芯片的算力、圖像處理、功耗、成本等。
所以,從上、下游兩個層面來看,下游會提出更多智能化需求,包括場景內的語音識別、圖像識別、文本處理等,上游傳感器供應商正在下沉,實現技術創新、產品創新抑或產業創新。上中下游均呈現明顯的技術革新趨勢。
在 AI 安防產業圖譜中,增加了智能應用服務的層,主要是以商湯、曠視、云從、依圖為首的 AI 算法公司。這種 AI 公司的入局也給整個安防行業帶來了變化。
其次,原本華為處于整個安防產業的下游,更多地是提供一些 ICT 服務,現在其通訊業務具備云端的能力,海思芯片在安防行業的市場占有率非常高。像華為一樣的巨頭進入,對整個安防行業的格局來會產生深遠影響。
智能安防三大落地方向
未來智能安防落地方向在哪里?我認為在三個層面。視頻結構化。視頻結構化的概念已出現多時,是指利用計算機視覺和視頻監控分析方法對攝像機拍錄的圖像序列進行自動分析,包括目標檢測、目標分割提取、目標識別、目標跟蹤等。主要作用是為未來人工智能進行數據追蹤和關聯分析提供事前預警。生物識別技術。生物識別技術是指利用人體生理特性和行為特征來進行個人身份驗證的技術。現在的人臉、指紋、虹膜、聲紋識別都屬于生物識別技術,未來將會在安防行業得到大規模推廣和廣泛應用。物體識別技術。物體識別的典型案例就是車牌識別,如今車牌識別已成為許多智能停車場的標配。使用車牌識別技術,采集車輛圖像,能夠減輕停車場管理運營的人力成本,提高通行效率。
智能安防市場規模
智能安防的市場規模如何?雖然這些數據的統計時間較早,但是也有一定的參考價值。2017 年,中國安防市場的資產規模達到 6220 億,2018 年,智能安防的資產規模接近 300 億。預計 2020 年以后,智能安防將創造千億級的市場,所以智能安防市場不容小覷。
智能安防的痛點
智能安防是熱門話題,但具體落地的情況如何?中國一年就有超過 5000 萬個攝像頭的市場需求,但實際只有 50 萬個智能攝像頭在應用,比例不到 1%。為什么?第一是成本。前端部分、存儲和視頻分析是智能安防高成本的主要因素。集成施工、機房改造等系統建設的時間和人力成本,也提高了智能安防的落地成本。第二是數據,安防領域的數據比較分散,存在許多數據孤島。盡管我們一直追求建設智慧城市,倡導數據共享,但這些數據分布在不同的體系里,包括公安、交通、城管等,很難實現共通共享。如果沒有數據,人工智能也無法進行數據分析和支撐。第三是人工智能應用的深度不足,現在的人工智能技術應用于小范圍或者單目標場景。像安防這種大范圍的監控,還有人、車、物的關聯分析需要專業能力和專業技術的積累。最后一個是人工智能識別技術對視頻成像的質量有較高要求。為什么會有高要求呢?這就是我后面要展開的,3D 視覺與智能安防到底是怎樣的關系?
3D 視覺賦能安防新機遇
人工智能與 3D 視覺
AI 分為三個階段,感知、認知和決策。感知就是 AI 通過不同的傳感器接收物理世界的信息;認知就是 AI 通過算法判斷、理解信息;決策就是 AI 的大腦,做綜合的分析,并執行相應的動作。感知也分很多種,比如視覺、聽覺、嗅覺、觸覺等,這些都是通過不同傳感器去實現的。感知技術里占比最大的是視覺,視覺在整個感知里占比 70%以上。傳統意義上的視覺是以 2D 為主,現在 2D 的清晰度也越來越高,4K、8K 都已出現,但依然停留在二維、單維的層面,只能解決看得清的問題,缺少了物理世界中的 3D 圖像,即深度信息。深度信息到底是什么?舉幾個例子,第 1 張圖看鴿子的大小,從這個視角上看,鴿子比遠方的行人要大;第 2 張圖里一個人從窗口探出一只手抓住汽車,感覺汽車變成人手中的玩具;第 3 張圖中杯子上面的螞蟻好像和遠處飛過的直升飛機一般大。在二維圖像里,因為不同的拍攝角度,近大、遠小并不是現中的真相。
3D 與 2D 圖像的區別
我們現在看到的所有圖像、視頻都是通過 2D 攝像頭平面成像,2D 無法識別物理世界中的三維信息,比如尺寸、體積、距離等幾何數據。3D 攝像頭是立體成像,能夠識別視野內空間上每個點位的三維坐標信息,把這些坐標信息給到計算機和芯片,通過三維成像算法,能完整復原出整個三維圖像。
三種 3D 視覺成像技術
3D 傳感技術主要分為結構光、ToF 和雙目視覺三種,不同的技術路線決定了精度曲線,進而決定應用場景。
傳統的普通雙目門禁就是雙目立體視覺代表,它主要通過三角測距計算出深度信息。但它受環境光影響大,同時需要大量特征識別、立體匹配的算法,匹配和計算過程復雜,難以生成實時的、穩定的深度信息。
現在主流的 3D 成像技術是結構光和 ToF,這兩種技術都是主動光技術。結構光的特點是近距離(1-2 米)精度非常高,可以達到毫米級,而且它的分辨率高,成本相對比較低,適合集成。ToF 的特點是距離長,能達到 5-10 米,蘋果剛剛出來的一款 iPad 就搭載了 ToF 的激光雷達傳感器。這種傳感器可以實現未來 VR 和 AR 的一些功能,但是它點云密度低、掃描延時大、深度圖分辨率低,精度比結構光要差,深度矯正困難。所以結構光和 ToF 各有優缺點。現在很多手機已經開始應用 3D 攝像頭,主要的關鍵點有兩個:前置還是以結構化為主;后置會以 ToF 的相機為主。
2D 與 3D 在安防產品的應用中有哪些區別?第一個區別是光線,2D 攝像頭在光線較暗的場景下成像質量非常差,尤其是需要附加類似智能分析的功能時,分析效率存在較大問題,會有很多錯檢、漏檢,雖然會有紅外光進行補充,但實際上在紅外上做智能分析會缺失很多信息。第二區別是人體特征檢測,2D 只有 XY 這樣的平面信息,缺乏深度數據,無法對目標進行精準定位與持續跟蹤。第三個,目標重疊的時候,2D 攝像頭很難把分析目標從背景中分離出來。而且 2D 無法做活體檢測,人臉識別中,如果沒有 3D 的活體檢測,很容易受到照片與視頻的偽裝攻擊。另外,現在安防家用攝像頭很普遍,但是隱私泄露隱患給公眾造成了心理壓力和安全問題。
3D 能夠帶來什么樣的改變?首先,3D 是主動光技術,可以在完全無光照環境下正常的工作。在強光、逆光環境下也能達到較好成像效果。第二,可以獲取空間中的三維數據,包括尺寸測量,空間中人、車的位置,身高、體重、距離、速度等,都可以精準的計算出來。另外還可以進行背景分離,實現實時的、動態的人體人像摳圖,在進行智能分析時去除背景干擾,提高算法分析準確率。還可以進行活體檢測與識別,在家庭安防、車內安防等私密場景中,我們只需要一些深度信息,即可以實現這種安全監控與行為分析。安防系統中的生物識別技術生物識別技術正成為世界范圍內使用最為廣泛的技術之一,市場上主流的生物識別技術主要有人臉識別、指紋識別、虹膜識別、聲紋識別。它們有哪些優缺點?
我認為指紋識別的應用性比較好,成本較低,技術較成熟,但是用戶體驗差,比如手指有破損或者有水有汗的時候,經常識別不出來。另外它的防攻擊能力弱,會帶來很多安全隱患。虹膜識別的安全性是最高的,但是它的易用性很差,而且成本較高。指靜脈也是一樣,安全性高,成本高,適用性很強。人臉識別技術比較成熟,成本也適中,可以實現無感識別,在人機交互方面比較自然,唯一的缺點還是安全性低。
人臉識別的安全性怎么會低呢?試舉以下幾個案例:去年嘉興一群小學生利用父母的高清照片成功在快遞柜上刷臉取件;智能門鎖很多也應用了人臉識別,但媒體做了一個小測試,拿出打印好的業主照片,對準門口的攝像頭,輕易地就把門打開了;有一次我住酒店時看到前臺有自助酒店服務終端,我就把我的身份證和照片發給我的同事,他用我的身份證和照片,輕而易舉地完成了核驗,拿到了房卡。其實基于 2D 的人臉識別有很多漏洞,雖然現在很多廠商宣稱其使用的雙目、AI+RGB 能做到活體檢測,但是這種技術被攻破幾率很大。
基于 3D 圖像的人臉識別
奧比在做 3D 活體檢測實驗中,工作人員用很多的假體,包括頭套、面具、照片攻擊 3D 人臉識別系統,系統能夠非常準確地判斷。在整個活體檢測實驗中,我們采用 2000 多種不同材質的假體做大量實驗,做相應的算法去規避這些假體對人臉識別系統的攻擊。去年我們取得了銀行卡檢測中心的“活體檢測”認證報告。奧比中光涉獵新零售業務,需要保證刷臉支付的安全,支付寶刷臉支付終端就使用了奧比中光的 3D 攝像頭。我們在智能門禁領域做了一些嘗試,有個合作伙伴戴頭套測試我們做的一款閘機,系統植入了 3D 信息,跟 2D 算法融合,在速度和效率上有成倍提升,所以系統很快識別出來,這款閘機目前主要供應給銀行、政府部門等重點安防場所。我認為未來高鐵站的刷臉進站、海關的刷臉通關以及更多的場景都會逐步替換成有 3D 視覺的設備。
除了人臉識別以外,安防有一個很重要的場景叫行為分析。傳統的 2D 行為分析更多的是靠數據訓練深度學習和識別能力。3D 視覺對視頻里的異常行為能夠實時地跟蹤與判別,例如突然倒地、突然劇烈運動、人數異常、區域入侵等事件。我們在很多場景中已經開始使用 3D 視覺,智慧養老場景中,為家里的老年人做異常姿態檢測;智慧金融場景中,檢測異常情況,例如有人倒地、打架斗毆或者有人徘徊等事件;在智慧監舍場景,由于監舍對犯人的行為監控要求非常高,用 3D 攝像頭可以識別他們的一些高危險行為。
我們也有客流分析系統方面的案例,主要在公交車領域,統計單位時間內上下客流的情況,實時數據會傳送到車輛指揮調度系統,幫助調度中心進行車輛的指揮和調度,在高峰期可以調整運營、減輕壓力。刑偵領域需要進行犯罪現場的實景還原,原來只能拍照、錄像或者現場人工測量,現在 3D 視覺系統可以把整個犯罪現場完整地進行掃描和復刻。因為犯罪現場不能一直保留,查案時可以在這種三維系統里進行重新排查。另外,庭審時也可以復原整個案件、插入語音講解、播放圖像視頻等,能夠非常直觀地呈現案件發展過程。
奧比中光公司簡介
奧比中光成立于 2013 年,雖然成立至今只有 7 年時間,但是發展迅猛。公司共有員工 700 余人,其中研發人員占據 70%以上。奧比中光是全球第四家能夠量產 3D 消費類傳感器、攝像頭的公司,前面三家分別是蘋果、微軟和英特爾。目前奧比中光已經進行了 D 輪融資,由螞蟻金服領投,估值超過 100 億,公司全面覆蓋 20 多個業務領域,全球攝像頭的出貨量已經超過 300 萬臺。奧比中光自成立伊始就一直堅持自主研發,尤其在芯片的自主研發上不斷攻關。
2015 年,公司成功研發出國內首顆 3D 深度計算芯片,一定程度上打破了歐美國家的壟斷,同年這款 3D 攝像頭實現量產,到現在為止還在銷售。2017 年,公司第 2 代 ASIC 芯片流片成功,同年研發出手機 3D 攝像頭,2018 年第 3 代芯片研發成功。所以 2015 年到 2018 年三年時間,公司生產了三代芯片的流片。2018 年 OPPO Find X 發布,其中就搭載了奧比中光的 3D 攝像頭模組。
奧比中光今年計劃打造國內首個 3D 視覺開發社區,社區將作為安防與其它行業開發者對接 3D 視覺技術的窗口。公司還將組織 3D 視覺的開發者大賽,讓所有的開發者都能獲取 3D 視覺高效和專業的服務。“讓所有終端都能看懂世界”是奧比中光的企業使命,我們希望能在安防領域繼續生根,與合作伙伴一起團結協作,讓 3D 視覺技術在更多場景中落地。
上一篇:華東科技2019全年凈利同比下滑471.28%,國產面板市場仍不景氣
下一篇:AI安防與BATH必有一戰
推薦閱讀
史海拾趣
隨著業務的快速發展,Antenova公司積極拓展全球市場。公司在全球范圍內設立了多個研發中心和銷售網絡,以便更好地服務客戶并拓展市場份額。通過與全球知名企業的合作,Antenova的產品得到了廣泛應用,進一步提升了公司的品牌影響力和市場競爭力。
為了更好地拓展市場,D3 Semiconductor與全球知名的電子元件分銷商貿澤電子(Mouser Electronics)建立了合作伙伴關系。根據協議,貿澤電子儲備了D3 Semiconductor的完整650伏額定電壓超結MOSFET產品線,并將其推向全球市場。這一合作不僅加強了D3 Semiconductor在全球市場的競爭力,也為公司帶來了更多的商業機會。
在全球化的大背景下,D3 Semiconductor積極拓展國際市場。除了與貿澤電子的合作外,公司還與多家國際知名的電子企業建立了合作關系,將產品推向全球各地。同時,D3 Semiconductor還加強了在國際市場的營銷和品牌建設,提高了公司的知名度和美譽度。這一系列的努力使D3 Semiconductor在國際市場上取得了顯著的成績,也為公司的未來發展奠定了堅實的基礎。
作為一家以技術創新為核心競爭力的公司,D3 Semiconductor始終保持對新技術、新應用的關注和研究。公司不斷投入研發資源,推出了一系列具有創新性的半導體產品,滿足了市場的多樣化需求。這種持續創新的精神推動了D3 Semiconductor的不斷發展,也使其在競爭激烈的電子行業中保持領先地位。
Easy Braid的發展離不開一支強大的研發團隊。公司注重人才的引進和培養,為研發團隊提供了良好的工作環境和充足的研發資金。在研發團隊的努力下,Easy Braid不斷推出具有創新性和實用性的新產品,滿足了市場的多樣化需求。同時,研發團隊還積極參與行業標準的制定和推廣工作,為整個電子行業的發展做出了貢獻。
另一家名為“Innovative Memory Solutions”的公司,在2008年就開始布局HMC技術的研發。經過數年的潛心研究,該公司終于在2012年推出了首款商用HMC產品。這款產品的問世,不僅解決了傳統DRAM帶寬受限的問題,還顯著降低了系統延遲。Innovative Memory Solutions通過積極的市場推廣和與OEM廠商的合作,成功將HMC技術應用于高性能計算、數據中心等領域,實現了從研發到市場的成功跨越。