即將在6月舉行的CVPR 2019,是機器視覺方向最重要的學術會議。評選結果已經宣布,今年論文量增加了56%,與無人駕駛相關的論文和項目也是扎堆亮相。其中的一大亮點,就是以自動駕駛視覺為核心的CVPR WAD 挑戰賽。
今年的挑戰賽中,伯克利和滴滴將分別開放了自家的超大規模駕駛視頻數據集BDD100K和D2-City,BDD100K包含10萬個美國公開駕駛視頻,D2-City提供中國幾大城市的超過10000個視頻記錄。這些數據集都被標注了好了所有道路物體,以及天氣、道路和交通條件等關鍵對象和數據,以此催生能夠改變無人駕駛安全隱憂的算法。
按照伯克利的規劃,這次挑戰將集中在目標檢測與目標跟蹤任務的域適應上,并能夠在中美的不同城市場景中實現自動遷移。
那么,域適應對自動駕駛的安全問題究竟有多重要?我們通過一篇文章來搶先了解一下。
論自動駕駛的倒掉與重生
在解釋“域適應”之前,有必要先搞清楚,現在的自動駕駛技術都在頭痛哪些問題。
盡管無人駕駛測試車的上路里程和接管數據都越來越漂亮,但對于機器學習模型來說,如何在新的、未知的環境中也能和測試道路上表現的一樣優秀,這仍然是一個公開的難題。
舉個例子,自動駕駛汽車可以利用在硅谷的道路測試數據集訓練出一個表現良好的無人車模型。然而,同樣的模型如果被部署在波士頓這樣多雪天氣的地區,就可能表現得很糟糕,因為機器以前從來沒有見過雪。如何在差異化的環境中進行有效的自主操作,復用自己學到的經驗,這仍然是機器學習的一個難點。
如果說波士頓和硅谷,由于氣候和路況上的巨大差異,在一年的任何時候,都可以被系統標記為不同的域,可以通過不同的模型來解決。那么面對高度相似域,比如同樣是城市街景,但北京和重慶卻有著不同的道路設計,難度于是再一次升級了。
以往的解決方案是“吃一塹,長一智”。收集訓練集(包括失敗范例)的數據,提取特征,然后讓機器依據經驗誤差最小準則學習分類器。但這樣容易產生三個問題:
一是域之間的遷移效果不穩定。如果訓練集和測試集分布一致,則模型的遷移效果較好。如果分布不一致,在源域過擬合,目標域上則表現并不讓人滿意。
二是有限的變化性。通過標注好的訓練數據集所學會的策略,往往只能應對特定的環境和物理系統。而真實的世界常常會遇到動態變化,比如異常光線、特殊氣候現象等等,這些都會改變域屬性并讓無人車不知所措。
三是社會輿論的高風險性。要讓無人車系統從失敗中吸取經驗,首先,它要先犯錯。但這在目前普通居民對無人車安全非常擔憂的大環境下,無人車碰撞、剮蹭、識別太慢等問題都會被拿出來質疑,再采用依靠事故數據來學習如何避免錯誤的方法無疑是災難性的。
顯然,我們需要借助其他方法來調教無人車,來減少它在陌生環境中失敗的次數。“域自適應”就是其中之一。
那么,到底什么是域自適應學習?
先解釋兩個關鍵概念:
一是源域(source domain)表示與測試樣本不同的領域,但是有豐富的標注數據。比如伯克利和滴滴的駕駛視頻數據集BDD100K,以及D2-City。
一個是目標域(target domain)表示測試樣本所在的領域,無標簽或者只有少量標簽。當一輛無人車測試車從硅谷變換到波士頓的道路上,它面對的就是一個全新的目標域。
如何盡可能地復用它在源域數據集中得到的先驗知識,盡可能準確地對目標域物體實現檢測、跟蹤等學習任務,就成為無人車模型要面臨的一大問題。
我們再將任務分門別類梳理一下:
1.域適應的可能性。簡單來說,就是滿足哪些條件才有可能實現域自適應學習。這對模型的學習能力(算法也有學霸和學渣之分)、源域和目標域的相關性(比如硅谷和重慶的路面差異)、算法的誤差界分析(源域和目標域必須同時滿足最小近似誤差)、學習任務的先驗知識等,這四個問題的妥善解決,才能有效幫助機器進行域自適應學習。
2.魯棒性。在域自適應學習中,訓練樣本和測試樣本之間的分布不一致,因此導致源域上訓練的模型往往不適用于目標域的學習。而域自適應學習的魯棒性則能夠度量算法對訓練樣本改變的敏感程度,從而克服目標域泛化誤差界的“擾動”。簡單來說域自適應學習模型就是一枚“暖男”,對誤差的包容性更強。
3.統計估計的一致性。在確保模型可以對目標域進行學習之后,就需要解決域適應學習有效性的問題了。
這往往依賴于有效的源域和目標域的概率分布判斷也就是最考驗機器智商的一致性分析。使用盡可能少的樣本數,實現最小的誤差上界。好的域自適應性學習算法是不允許“偏科”的,泛化能力得非常強才行。
說了這么多,不難看出域自適應性學習本質上和人類的學習模式極為相似:在課堂上學習前人總結好的科學知識,然后在與現實的交流過程中不斷擴充新的知識并進行探索,完成對復雜事物的認知,從而達到自主學習、適應新科目的目的。
無人車的域自適應性學習也是同樣的邏輯:先利用已有的標注數據進行初始化學習,然后在大量未標注的數據中不斷依據先驗知識進行樣本挖掘,以增量地學習模型和適配未標注數據,從而在陌生的道路環境中也能表現良好地完成學習任務。
目前看來,域自適應性學習也是完成無人駕駛視覺任務成本效益較高的方式。
新的算法還在路上
既然“域適應”對于無人駕駛來說如此重要,那么目前究竟有哪些比較值得一覽的算法呢?
目前看來,由于無人駕駛任務自身的復雜性,往往需要 從多數據源向目標域進行遷移學習,這就必須考慮兩個難題:
一是多種源域數據本身之間具有偏差,比如伯克利的數據集BDD100K覆蓋了不同的時間、光照、天氣和地理位置,甚至包含了GPS和IMU以及對應的時間戳信息;
二是多種源域數據間類別存在偏差。比如滴滴D2-City數據集中,將注釋了包圍框和跟蹤ID的道路對象分為12個不同的類別,而伯克利的數據集BDD100K中的GT框標簽則只有10個類別。
這些都對算法性能提出了不少挑戰。在此,我們不妨列舉幾個具有代表性的算法,看看他們是如何解決無人駕駛相關技術難題的:
1.自適應曝光算法。前面提到,不同城市和路面環境的光線強弱都是不同的,為保證無人駕駛車輛在各種光線環境都能夠獲取可靠的道路信息,有研究人員提出了一種自適應曝光算法。利用光學傳感器將采集圖像轉化為灰度值,并逐行進行動態閾值比對處理,快速獲取下一周期正確曝光點。在道路實際的測試中,該算法能夠快速并有效獲取道路信息,后續的邊界處理較為清晰。
2.路面障礙物檢測。原理是利用已有的先驗知識,比如從源域圖像中學會辨識障礙物的顏色、邊緣、紋理特征等等,對目標域道路上的不同車輛進行分析并快速提取出障礙物。
這方面的算法很多,比如Zielke等人利用馬路邊緣的對稱性與顯著性來提取馬路邊緣信息。Kuehnle等人基于圖像中車輪的對稱性來識別車的后輪。Crisman等人利用視覺圖像中的顏色信息實現了馬路跟隨等等,都從不同程度提升了無人駕駛目標檢測的性能。
3.多源域數據遷移算法。商湯的研究人員提出了一種名為“雞尾酒”的網絡,以解決將知識從多源域的數據向目標域遷移的問題,來幫助無人車模型更有效地識別新環境。
具體的做法是,利用共享特征網絡,對所有源域以及目標域進行特征建模,然后利用多路對抗域適應技術(類似于GAN生成器),每個源域分別與目標域進行兩兩組合對抗,以此明確學習域的不變特征,極大程度地降低系統因數據偏差而對環境進行誤判。
歸根結底,“域自適應”方法不僅降低了訓練風險,也有效地提升了系統的學習性能。從這個角度想,就更期待在CVPR 2019挑戰賽中見到新的黑馬了!
多說一點:
現在看到“無人駕駛”這四個字,絕大多數人會想到什么?圈內人可能會覺得“涼”,而普通民眾則是“反感”。
2019第一季度剛剛過去,關于無人駕駛的負面新聞層出不窮:
去年創下融資紀錄的RoadStar.ai星行科技死于內訌,成為第一家倒下的無人車公司;蘋果自動駕駛部門裁員190人,無人車數量減少到62輛;有吳恩達背景的美國自動駕駛創業公司Drive.ai上個月也傳出了“賣身”的消息。
產業之所以受挫,實在是因為無人車的安全性難以完全說服民眾。
就在前兩天,有研究人員通過在路上貼貼紙之類的“物理攻擊”就讓特斯拉的自動駕駛汽車并入了反向車道,甚至還能在沒有車主授權的狀態下用Xbox 游戲手柄操控。
即便是在無人車最為成熟的灣區,也有不少當地居民扎胎的扎胎,拿槍的拿槍,讓人對無人駕駛的未來有點灰心。
而當前景變得不再明朗的時候,或許,追求技術才是最終的續命之道。
以往在計算機視覺、機器學習等領域的頂級會議中,關于域適應的研究都集中在圖像分類和語義分割方面,很少看到實例級任務上的應用,如目標檢測及跟蹤,盡管它們對于無人駕駛來說更加重要。
當然,想要讓“域適應”幫助無人車更有效的訓練,只靠伯克利和滴滴在CVPR 2019中釋放的數據集或某一場比賽還遠遠不夠,還要為研究者提供更多元的支持,比如增強研究團隊與車企的聯系,圍繞真實需求進行配套研發等等。
在此之前,這項復雜的技術還是老老實實地待在實驗室和測試道路上吧。
上一篇:Elektrobit (EB) 為大眾新一代電動汽車提供開發平臺
下一篇:智慧城市需要關注哪些亮點?公共運輸或是其中一種
推薦閱讀
史海拾趣
在快速發展的過程中,Electro-Term公司始終重視人才培養和團隊建設。公司建立了完善的人才選拔和培訓體系,為員工提供廣闊的發展空間和良好的福利待遇。同時,公司還鼓勵員工積極參與創新實踐和技術交流,營造了濃厚的學術氛圍和團隊合作精神。這些舉措為公司的發展提供了有力的人才保障。
Hollingsworth公司一直以來都堅持品質至上的原則。公司投入大量資源用于產品質量控制和檢測,確保每一件產品都符合最高標準。這種對品質的堅持不僅贏得了客戶的信任,也幫助公司在市場上建立了良好的口碑。隨著時間的推移,Hollingsworth的品牌價值不斷提升,成為電子行業中的佼佼者。
Anvo-Systems公司自成立以來,一直致力于電子技術的研發與創新。某年,公司成功研發出一款具有高效能源利用率的智能家居控制系統,該產品迅速在市場上獲得了廣泛關注。通過不斷優化產品性能和用戶體驗,Anvo-Systems逐步擴大了市場份額,并與多家知名家電品牌建立了合作關系。這一技術突破不僅提升了公司的知名度,也為公司的持續發展奠定了堅實基礎。
隨著公司業務的不斷擴展,Anvo-Systems開始實施國際化戰略。公司先后在亞洲、歐洲和北美等地設立了研發中心和生產基地,以更好地滿足不同地區的市場需求。同時,Anvo-Systems積極參與國際電子展會和技術交流活動,與全球同行建立了廣泛的合作關系。這一全球化布局不僅提升了公司的競爭力,也為公司的長期發展打開了新的空間。
Anvo-Systems在發展過程中始終注重企業文化建設和社會責任履行。公司倡導創新、協作、誠信的企業精神,為員工創造了一個積極向上的工作環境。同時,Anvo-Systems還積極參與社會公益活動,關注環保和可持續發展等問題。通過這些舉措,Anvo-Systems不僅提升了企業的社會形象,也為社會的和諧發展做出了積極貢獻。
請注意,以上故事純屬虛構,不代表現實中任何公司或行業的真實情況。在實際應用中,應根據具體公司的歷史和發展情況進行調整和完善。
本人現在正在做一個燃氣泄漏檢測方面的項目,因為以前是搞Verilog HDL語言設計的,所以頭一下子大亂起來。請各位大蝦出來指教,給本人提供一些氣體檢測方面的電路,謝謝!… 查看全部問答∨ |
|
evc應用程序打不開我自己寫的按鍵驅動。 HANDLE hReadKeyThread; //打開key驅動 hFile=CreateFile(TEXT("KEY:"),GENERIC_READ|GENERIC_WRITE,0,NULL,OPEN_EXISTING,0,0); ...… 查看全部問答∨ |
|
恩智浦推出全球首款雙電源電壓ARM Cortex-M0微控制器 1.6 uA深度睡眠電流、5 us瞬間喚醒和超小尺寸,為創新嵌入式移動設計創造可能 中國上海,2012年2月21日 —— 恩智浦半導體NXP Semiconductors N.V. (NASDAQ:NXPI) 近日宣布推出LPC1100LV系列,這是全球首款支持1.65V至1.95V VDD ...… 查看全部問答∨ |
|
字符串處理,--不用IO函數 連接a和b,存到c中: char *cat(char *a,char *b,char *c) { while (*a!=\'\\0\') *(c )=*(a ); while (*b!=\'\\0\') *(c )=*(b ); *c=\'\\0\'; return c; } 將b連接到a的后面,新字符串保存到a中: ...… 查看全部問答∨ |
電子產品中常見到的三端 穩壓集成電路有正電壓輸出的78 ××系列和負電壓輸出的79××系列。故名思義,三端IC 是指這種穩壓用的集成電路 只有三條引腳輸出,分別是輸入端、 接地端 和 輸出端。它的樣子象是普通的三極管,TO- 220 的標準封裝,也有9 ...… 查看全部問答∨ |
本帖最后由 paulhyde 于 2014-9-15 03:02 編輯 我有一個音響,開大聲了就有雜音, 只要我用身體碰觸音響上的螺絲時,雜音就消失了, 我就想是否可以連接一個什么元件的,代替我的身體(我試過螺絲連接地線,雜音更大了) 達到消除雜音的效果 ...… 查看全部問答∨ |