娇小w搡bbbb搡bbb,《第一次の人妻》,中国成熟妇女毛茸茸,边啃奶头边躁狠狠躁视频免费观看

歷史上的今天

今天是:2025年03月20日(星期四)

正在發生

2020年03月20日 | 讓機器理解三維世界,「商湯科技」暢想人工智能3D視覺技術的未來

發布者:pcwg 來源: 智家網作者: Lemontree 手機看文章 掃描二維碼
隨時隨地手機看文章

在上世紀70年代,工業界開始運用3D視覺技術測量和掃描物件,提高生產效率。最近10多年,家用游戲機廠商將3D體感外設帶入大眾視野,帶來了新奇的體感游戲。近三年,越來越多的智能手機開始配備3D傳感器,并在AI的加持下,開拓出了更多更具想象空間的應用場景。未來10年,AI+3D將無處不在,給我們的生活和工作帶來深遠影響。

賦予機器感知三維世界的“眼睛”

人類擁有與生俱來的3D環境感知和理解能力,這是因為我們用兩只眼睛來捕捉圖像,通過大腦處理形成立體視覺,從而辨認物體的形狀方位、他人的動作,輕松自然地跟這個三維世界交互。

能否讓機器也能感知三維世界呢?或許很多人會想到給機器添加一顆攝像頭。但普通RGB攝像頭拍攝的現實世界的影像,僅能采集場景中的色彩信息,無法采集物體和攝像頭之間的距離和方位。也就是說,無論場景中的三維結構有多么豐富,對機器來說都是一個平面,一個二維世界。

3D視覺技術,就是賦予機器感知三維世界的信息和能力,并給我們帶來顛覆性的價值。試想一下,將汽車立體模型通過增強現實(AR)技術投射出來,客戶可360度觀看,還能“開車門”,由此直觀地提出意見,而不是一張張翻看照片;或者派無人機探索森林或洞穴,一邊前行一邊繪制周邊場景的三維地形,而不是我們拿著一張平面地圖親自探險……

事實上,3D視覺技術目前已經在工業界取得成功,但在消費領域,受限于3D感知硬件的成本和體積、計算能力等困擾,很多場景并未激活。除了掃地機器人等個別終端外,我們的智能手機等移動設備,還處在二維世界里。但近幾年,3D視覺技術終于開始走向個人終端,機器認知世界的新大門正在打開。

3D感知硬件小型化,ToF漸成主流

實現3D視覺能力,3D感知硬件的加持至關重要。目前主流的3D感知硬件技術包括雙目視覺、結構光、ToF(飛行時間)以及激光雷達

雙目視覺系統是通過雙攝像頭同時進行成像,然后通過對比兩個圖像中每個像素點的相對位置差,來計算出該像素點在三維環境中的位置,類似于人雙眼的工作原理。

結構光和ToF則能在RGB的基礎上直接提供深度信息,屬于RGB-D方案,在精度上比雙目視覺更勝一籌。其中,結構光是通過投射大量光斑到物體上,然后根據光斑的形變量來判斷其所處深度;ToF則是向物體發射連續的光脈沖信號,并接收返回的信號,通過計算信號發射和返回的時間來計算深度信息。相比之下,結構光在較短距離內擁有更高精度,而ToF支持的工作距離更長,適用于更加多元化的場景,且傳感器模塊少,體積小。

激光雷達的原理與ToF類似,但其感知距離更遠,范圍更大,精度也更高。很多自動駕駛汽車通過激光雷達來感知周圍環境,不過缺點是成本過于高昂,只適用于特定場景。

在最近的三年,我們觀察到的一個顯著趨勢是ToF和結構光的小型化,使得它成功地應用到了手機當中。而ToF以其體積更小、適用場景更廣等優勢,逐漸受到更多廠商青睞,很多最新的旗艦手機都將ToF作為一大賣點。據統計,2019年有約5000萬臺配備ToF的手機出貨,業內預計2020年、2021年將分別達到1.5億和5億臺,逐漸呈現出爆發態勢,2020年全球智能手機3D感知硬件市場的規模也將到達99.25億美元。

ToF在智能手機上的加速應用,有助于3D視覺技術的廣泛普及化,成為接下來10年中非常重要的科技趨勢。深入地觸達消費市場,也激活了更多的應用創新可能。

AI技術,突破3D視覺技術的難點

3D感知硬件能夠提供距離、深度等數據信息,但我們要的并不是單純的數據,而是基于這些數據,通過不同的表達和理解方式,實現不同的應用。比如對三維場景進行數字化建模,或者繪制三維地圖,從而讓機器能夠實時感知自己在所處空間中的位置,以便在運動時及時避開障礙物等。這需要根據深度信息生成深度圖像,并與RGB圖像,甚至是紅外圖像進行融合并完成大量計算。

但是,通過硬件感知的信息生成的深度圖像,往往存在因硬件性能限制而產生的瑕疵,例如在細小或復雜交錯的物體之間,出現深度信息估計錯誤等問題。此外,精準度、魯棒性、實時性、效率等都是決定實際應用效果的關鍵。這都需要依靠額外的算法進行實時處理予以彌補和增強。

在工業場景中,由于應用相對單一,且3D感知硬件大多處于固定或平穩狀態,很多難題可以通過編寫特定算法加以解決。但在移動終端上,不規則的抖動、晃動等情況帶來的難以預估的挑戰,傳統算法難以突破。

2012年,AI在計算機視覺領域取得突破,給3D視覺技術發展也帶來了全新思路。AI可通過對大量實際數據進行學習,自行總結其中的規律和特征。這種方法可以在短時間內,完成傳統算法需要多年才能突破的問題,有效彌補硬件能力的不足。

更為重要的是,AI不僅能感知場景中的三維結構,還能識別出場景中的三維物體是什么,在做什么。例如檢測人、物體,識別人的姿態,跟蹤物體的運行軌跡……這就進一步敞開了機器認知世界的新大門。

在我們看來,3D硬件的小型化,是3D視覺技術應用場景拓展和創新的硬件基礎,而AI技術則是真正的動力引擎。兩者密不可分,可以說,AI+3D視覺技術拐點已至。

AI+3D,緊密協作實現完美空間感知

目前,商湯科技已經將AI技術廣泛地應用于3D感知的各個領域,開發了基于ToF等3D感知硬件的技術與產品,包括人臉與人體3D重建、物體重建、3D全身關鍵點跟蹤、3D Avatar驅動工具、AR測量、AR場景互動、AR導航、3D人臉認證、3D攝影等等,均體現了AI+3D的顯著優勢。

首先,AI+3D可以進一步優化感知效果,提升用戶體驗。以動作捕捉為例,結合對深度信息的高效處理,能夠整體提升肢體關鍵點的穩定性、準確性以及運動的穩定性和自然度,精準呈現人在三維空間中的動作姿態變化;

第二,AI+3D可以更加高效地應用和處理深度信息,理解環境中人物間的相互關系。例如為AR帶來逼真的虛實融合和互動效果,在智能手機上完成高精度3D模型建模,或是為自動駕駛提供車外的人、車、物的識別和距離感知。

第三,AI+3D可以更加精準地分割圖像中的主體和背景。特別是在主體和背景顏色比較相近的情況下,得益于對深度信息的快速處理,在分割效果上比2D感知技術有很大的提升,可提供不同人物之間的語義信息,亦可結合3D相機系統帶來更逼近單反的攝影效果;

第四,深度信息與紅外圖像的結合,可以讓3D感知適用于更多的場景,使之不受環境光線明暗的影響。

在提供算法的同時,商湯科技也與產業上下游合作伙伴緊密合作,提供軟硬一體解決方案,推動AI+3D的發展和生態構建,推動應用場景的革新。

基于上述優勢,我們認為,AI+3D會從人機交互、互動娛樂、內容創作、身份驗證、拍照、電商等層面激發大量的創新應用場景,甚至改變很多傳統行業的運作模式。

AI+3D,激活更多創新的應用場景

隨著越來越多的智能手機配備3D感知硬件,AI算法的作用也越加凸顯,只有兩者的緊密協作,才能夠將完美的影像體驗帶給最終用戶,缺一不可。為此,商湯科技一直積極與合作伙伴攜手共進,將AI+3D相關產品和技術充分應用于手機等智能終端當中。

比如,通過AI+3D進行“物品重建”。商湯科技的通用3D重建技術,讓用戶只需拿手機沿著物體360度環繞掃描,就能將其掃描成數字模型,并用于3D打印、3D/AR相冊預覽、短視頻直播內容生成,或植入到游戲、電商商品展示等場景。特別是后者,它可讓顧客通過翻轉方式查看物品外觀,告別翻看照片的麻煩。

除物品重建,還可以“人臉重建”。2018年,商湯科技助力合作伙伴推出了市面上第一款具備3D人臉重建功能的手機。用戶不僅可以體驗比2D美顏更加精美的3D美顏功能,還可足不出戶輕松地進行虛擬試妝,甚至通過“3D微整形”來模擬整形效果。

AI+3D讓手機就能成為體感設備。玩家可低成本地暢玩體感游戲,而內容創作者則借助商湯的Avatar技術打造自己的虛擬形象,例如虛擬主播、虛擬講解員或者虛擬教師,通過表情、動作進行驅動,這會為互動娛樂、文旅乃至教育打造新的發展模式。

AI+3D也將在很大程度上推動移動AR朝向3D AR方向發展。基于RGBD SLAM可重建真實環境的3D結構,準確將虛擬元素植入到真實環境中,呈現真實的遮擋、碰撞、反彈等效果。

商湯還與浙江大學共建了“浙江大學-商湯三維視覺聯合實驗室”,在SLAM和三維重建等領域的前沿研究展開深入合作,并推出了高精定位與內容增強解決方案,實現高精度的AR導航等功能。

有了3D AR,手機還能搖身一變成為更強大的AR測量尺,實現遠超基于2D方案的測量精度,場景覆蓋率到初始化耗時,還可以自動檢測并測量立體幾何物體。


AI+3D也將讓3D人臉識別成為更便捷、更安全的解鎖或支付方式。商湯科技不僅在2018年助力合作伙伴推出了市面上首款基于結構光的3D人臉識別安卓手機,還于同年底推出了基于ToF的3D人臉識別方案。此外還推出了3D人臉識別智能門鎖解決方案,推動智能門鎖行業的創新。

媲美單反的大景深效果一直是手機人像拍照所追求的方向,3D視覺技術可以讓人物等主體與背景的過渡效果更加自然、更加精準。而在電商行業,AI+3D可以讓AR試妝、AR試衣、AR家居更加逼真,滿足多角度充分預覽,促成購買行為。

放眼汽車行業,AI+3D技術能夠實現更加精準的車外人、車、物識別和距離感知,有力推動自動駕駛的發展。商湯科技也正以“攝像頭為主、多傳感器融合”的解決方案,研發L4級自動駕駛解決方案。而在泛工業領域,AI+3D可以為機械臂賦予3D感知能力,準確判斷物體所處的位置、尺寸、形狀等,從而進行精準的抓取,或是進行自動化的品質檢測。

《Prediction Machines》一書中曾提到:“當某種基礎產品價格大幅下降的時候,才是整個世界發生變化的基礎”。3D視覺技術呈現出的也是這樣一個趨勢。放眼未來,3D視覺技術還有更多創新空間。首先硬件成本的下降使其更加普及,支持的工作距離更遠,而AI技術隨著表達能力將不斷增強,算法模型的小型化等趨勢,可讓深度信息處理更高效,3D效果更逼真、更穩定,性能更快,同時硬件資源占用率更低。一方面不斷優化現有應用的體驗,另一方面進一步開拓更多應用可能。

新的10年, AI+3D將成為變革行業發展的全新引擎。


引用地址:讓機器理解三維世界,「商湯科技」暢想人工智能3D視覺技術的未來

上一篇:可以抓取物體并輕松移動的軟體機器人你見過沒?
下一篇:我國無人機市場規模逐年增長 年均復合增速高達73.33%

推薦閱讀

據寧夏日報報道,3月18日,總投資16億元的寧夏銀和半導體科技有限公司大尺寸半導體硅片項目在銀川經濟技術開發區開工。該項目的落地,標志著“中國芯”不斷向高端領域延伸。據悉,寧夏銀和半導體科技有限公司將通過開展高品質半導體硅片的研發和產業化,建成國際先進水平的大尺寸半導體硅片產業化、創新研究和開發基地。項目建成后,可年產420萬片8英寸半...
1) Model 3將樹立新的產品力標桿,扮演類iphone 4的角色不論是進口版還是國產標準版的Model 3,都將在各自領域樹立清晰的產品力標桿,市場所有產品以此為基準重新定位,Model 3將扮演類iphone 4的角色,大大加速中國智能電動化的進程; 2) Model 3的產品理念將深深影響后續的整車設計無論是否把Model 3作為競品,對Model 3開展詳細研究將成為...
掃地機器人逐漸走進了更多家庭,這個小小的“寵物精靈”能自己跑到每個角落幫你打掃衛生,但不少人仍然持有懷疑態度,這個看起來“傻傻”的掃地機器人好用嗎?相對吸塵器來說,掃地機器人可謂跨越式的提升,而作為吸塵器領域的佼佼者——戴森,當然也少不了掃地機器人。 戴森的 360 heurist是一款非常實用的機器人,在諸多性能上取得了顯著的突破,它...
當地時間18日,中共中央政治局委員、中央外事工作委員會辦公室主任楊潔篪、國務委員兼外長王毅在安克雷奇同美國國務卿布林肯、總統國家安全事務助理沙利文舉行中美高層戰略對話。楊潔篪在中美高層戰略對話開場白中闡明中方有關立場。圖自新華網楊潔篪在中美高層戰略對話開場白中闡明中方有關立場:我們希望這次對話是真誠的、坦率的。楊潔篪強調,美國沒有...

史海拾趣

問答坊 | AI 解惑

第11/15原創:事無巨細,PWM

事無巨細,PWM演示 這幾天總是很累,但是要堅持把這個系列寫完。今天講講PWM。 PWM對許多剛剛跨進電子設計的大門的朋友來說,估計是一個很陌生的名字。當然我本人也只是是一知半解,即便如此,還是盡我所能把我知道的引導給大家。 ★PWM,英文全 ...…

查看全部問答∨

Altera參考設計-AN 526: 3GPP UMTS Turbo Reference Design

The Altera® 3GPP UMTS Turbo Reference Design demonstrates using Turbo codes for encoding with trellis termination support, and forward error correction (FEC) in a 3GPP universal mobile telecommunications system (UMTS) design ...…

查看全部問答∨

LED驅動

現在LED背光的屏越來越多,但是一個很麻煩的問題就是LED背光座子不統一,相當惱火!前兩天老板讓設計一個公版,兼容現在LED背光屏!我的個神,當是我就蒙了。這么多種座子,怎么設計?各位大大一起收集下,給后面設計的兄弟一個好的參考!附件是我 ...…

查看全部問答∨

召集貼:嵌入式Qt編程的朋友

從WEB開發轉嵌入式了,有沒有做Qt開發的呀?留個QQ,大家有問題一起討論下 或者是給我推薦個群…

查看全部問答∨

嵌入式linux中關于Tasklets 機制的使用

1.嵌入式linux驅動中關于 Tasklets機制使用的多嗎,將驅動分為上下半,這樣會不會影響系統的實時性呢, 2.如果中斷不是很多,或者不會占用過多的時間,是不是可以不用Tasklets 機制呢? 小弟新手,莫笑小弟小白,望高手指點。…

查看全部問答∨

尋求單片機與藍牙芯片的電路圖或代碼

哪位大俠有藍牙通信的電路圖或代碼,跪求~~~~ …

查看全部問答∨

請問:如果處理器的RAM只有8K, FLASH只有32K, 能否移植UClinux系統啊, Ucos呢,(要想移植系統, 要多大的RAM,或FLASH啊?

如果處理器的RAM只有8K, FLASH只有32K, 能否移植UClinux系統啊, Ucos呢,(要想移植系統, 要多大的RAM,或FLASH啊?…

查看全部問答∨

溫度導致LED失效

典型的LED由光學透明的環氧樹脂封裝溫度升高到環氧樹脂玻璃轉換溫度Tg時,環氧樹脂由剛性的、類似玻璃的固體材料轉換成有彈性的材料。通常情況,在玻璃轉換溫度Tg,環氧樹脂的熱膨脹系數(CTE)會有很大變化,Tg位于熱膨脹系數劇烈變化區域的正中間, ...…

查看全部問答∨

ad603 單級調試

本帖最后由 paulhyde 于 2014-9-15 09:46 編輯 我們按照資料搭建了ad603的90MHZ頻帶的電路了,可是有自激,電源的去耦電容等都加了,就是消除不了自激啊,請用過的給指點,謝謝!  …

查看全部問答∨
小廣播
最新機器人文章

 
EEWorld訂閱號

 
EEWorld服務號

 
汽車開發圈

 
機器人開發圈

About Us 關于我們 客戶服務 聯系方式 器件索引 網站地圖 最新更新 手機版

站點相關:

詞云: 1 2 3 4 5 6 7 8 9 10

北京市海淀區中關村大街18號B座15層1530室 電話:(010)82350740 郵編:100190

電子工程世界版權所有 京ICP證060456號 京ICP備10001474號-1 電信業務審批[2006]字第258號函 京公網安備 11010802033920號 Copyright ? 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
主站蜘蛛池模板: 玛多县| 平利县| 杂多县| 双鸭山市| 和平县| 皮山县| 石首市| 浦北县| 元氏县| 澳门| 仪陇县| 灵川县| 乌审旗| 堆龙德庆县| 城口县| 哈尔滨市| 龙门县| 荆州市| 罗田县| 荃湾区| 宁化县| 慈利县| 曲沃县| 富川| 民勤县| 巢湖市| 张北县| 黔西| 江山市| 海丰县| 翼城县| 邳州市| 犍为县| 武强县| 云阳县| 乌苏市| 廉江市| 青岛市| 潞西市| 治多县| 虎林市|