對(duì)于人工智能 (AI) 而言,任何單一硬件或計(jì)算組件都無(wú)法成為適合各類(lèi)工作負(fù)載的萬(wàn)能解決方案。AI 貫穿從云端到邊緣側(cè)的整個(gè)現(xiàn)代計(jì)算領(lǐng)域,為了滿足不同的 AI 用例和需求,一個(gè)可以靈活使用 CPU、GPU 和 NPU 等不同計(jì)算引擎的異構(gòu)計(jì)算平臺(tái)必不可少。
依托于 Arm CPU 的性能、能效、普及性、易于編程性和靈活性,從小型的嵌入式設(shè)備到大型的數(shù)據(jù)中心,Arm CPU 已經(jīng)為各種平臺(tái)上的 AI 加速奠定了基礎(chǔ)。
就靈活性而言,這對(duì)生態(tài)系統(tǒng)大有裨益的三個(gè)主要原因是,首先,Arm CPU 可以處理廣泛的 AI 推理用例,其中許多用例通常用于數(shù)十億臺(tái)設(shè)備,例如當(dāng)今的智能手機(jī)、云和數(shù)據(jù)中心。不僅如此,除了推理之外,CPU 還經(jīng)常用于技術(shù)棧中的數(shù)據(jù)預(yù)處理和編排等其他任務(wù)。其次,開(kāi)發(fā)者能夠在更多種類(lèi)的數(shù)據(jù)格式中運(yùn)行更廣泛的軟件,而無(wú)需構(gòu)建多個(gè)版本的代碼。最后,CPU 的靈活性使之成為加速 AI 工作負(fù)載的理想工具。
提供多樣性和選擇,助力行業(yè)靈活部署 AI 計(jì)算
除了 CPU 產(chǎn)品組合外,Arm 計(jì)算平臺(tái)還包括 GPU 和 NPU 等 AI 加速器技術(shù),許多市場(chǎng)都在將這些技術(shù)與 CPU 進(jìn)行集成。
在移動(dòng)端領(lǐng)域,Arm 終端計(jì)算子系統(tǒng) (CSS) 包含 Armv9.2 CPU 集群,并與 Arm Immortalis-G925 GPU 集成,可為各種 AI 用例提供加速功能,包括圖像分割、對(duì)象檢測(cè)、自然語(yǔ)言處理和語(yǔ)音轉(zhuǎn)文本等用例。在物聯(lián)網(wǎng) (IoT) 方面,Arm Ethos-U85 NPU 可與需要加速 AI 性能的基于 Arm Cortex-A 的系統(tǒng)一起設(shè)計(jì),例如工廠自動(dòng)化等場(chǎng)景。
此外,除了 Arm 自己的加速器技術(shù)外,合作伙伴借助 Arm 的 CPU 靈活定制具有差異化的芯片解決方案。例如,NVIDIA 用于 AI 基礎(chǔ)設(shè)施的 Grace Blackwell 和 Grace Hopper 超級(jí)芯片均采用了 Arm CPU 和 NVIDIA 的 AI 加速器技術(shù),從而顯著提升 AI 性能。
NVIDIA Grace Blackwell 超級(jí)芯片將 NVIDIA 的 Blackwell GPU 架構(gòu)與基于 Arm Neoverse 的 Grace CPU 相結(jié)合。Arm 獨(dú)特的產(chǎn)品組合使 NVIDIA 能夠進(jìn)行系統(tǒng)級(jí)設(shè)計(jì)優(yōu)化,與 NVIDIA H100 GPU 相比,其能耗降低了 25 倍,單個(gè) GPU 性能提高了 30 倍。具體來(lái)說(shuō),得益于 Arm Neoverse 平臺(tái)的靈活性,NVIDIA 能夠?qū)崿F(xiàn)自有的高帶寬 NVLink 互連技術(shù),并提升 CPU、GPU 和內(nèi)存之間的數(shù)據(jù)帶寬和延遲。
Arm 致力于通過(guò) Arm 全面設(shè)計(jì)生態(tài)項(xiàng)目,為整個(gè)生態(tài)系統(tǒng)注入 AI 加速的機(jī)遇。通過(guò)該生態(tài)項(xiàng)目,開(kāi)發(fā)者可以更快訪問(wèn) Arm CSS 技術(shù),賦能軟硬件技術(shù)進(jìn)步,以此驅(qū)動(dòng) AI 和芯片創(chuàng)新,并加快開(kāi)發(fā)和部署 AI 優(yōu)化的芯片解決方案。
Arm 架構(gòu)滿足 AI 所需的獨(dú)特靈活性
Arm CPU 設(shè)計(jì)所具有靈活性關(guān)鍵在于 Arm 領(lǐng)先的架構(gòu)。它提供了一個(gè)可以與 AI 加速器技術(shù)緊密集成的基礎(chǔ)平臺(tái),并支持從 128 位到 2,048 位的各種向量長(zhǎng)度,可以在許多不同的數(shù)據(jù)點(diǎn)上輕松執(zhí)行多個(gè)神經(jīng)網(wǎng)絡(luò)。
Arm 架構(gòu)的靈活性為整個(gè)芯片生態(tài)系統(tǒng)提供了多樣化的定制機(jī)會(huì),Arm 一直致力于幫助合作伙伴更快地構(gòu)建自己的差異化芯片解決方案。這種獨(dú)特的靈活性也使 Arm 能夠不斷進(jìn)行架構(gòu)創(chuàng)新,定期推出關(guān)鍵指令和功能來(lái)加速 AI 計(jì)算,進(jìn)而惠及整個(gè)生態(tài)系統(tǒng),其中包括領(lǐng)先的芯片合作伙伴,以及在 Arm 計(jì)算平臺(tái)上構(gòu)建應(yīng)用的 2,000 多萬(wàn)軟件開(kāi)發(fā)者等。
這一切始于 Armv7 架構(gòu),該架構(gòu)引入了高級(jí)單指令多數(shù)據(jù) (SIMD) 擴(kuò)展,例如 Neon 技術(shù),這是 Arm 首次涉足機(jī)器學(xué)習(xí) (ML) 工作負(fù)載。在過(guò)去幾年中,該架構(gòu)不斷增強(qiáng),Armv8 中增加了向量點(diǎn)積和矩陣乘法特性,之后在 Armv9 中又引入了 Arm SVE2 和新的 Arm SME 技術(shù),為廣泛的生成式 AI 工作負(fù)載和用例提高了計(jì)算性能并降低了功耗。
與 AI 加速器技術(shù)無(wú)縫集成
Arm 是 AI 時(shí)代的計(jì)算平臺(tái),推動(dòng)了持續(xù)的架構(gòu)創(chuàng)新,以滿足速度更快、互動(dòng)性更好和沉浸感更強(qiáng)的 AI 應(yīng)用的發(fā)展。Arm CPU 作為靈活處理 AI 工作負(fù)載的異構(gòu)計(jì)算方法中的一部分,可以無(wú)縫增強(qiáng)和集成 GPU 和 NPU 等 AI 加速器技術(shù)。
Arm CPU 是處理眾多 AI 推理工作負(fù)載的實(shí)用之選,憑借出色的靈活性,它能夠與加速器技術(shù)無(wú)縫集成,打造更強(qiáng)大、更高性能的 AI 功能,精準(zhǔn)滿足特定用例和計(jì)算需求。對(duì)于 Arm 的技術(shù)合作伙伴而言,出色的靈活性有助于實(shí)現(xiàn)豐富的定制選擇,使他們能夠?yàn)?AI 工作負(fù)載構(gòu)建完整的芯片解決方案。
上一篇:Gartner:到2025年,全球公有云終端用戶(hù)支出將達(dá)到7230億美元
下一篇:Forrester“總體經(jīng)濟(jì)影響研究”表明,Akamai Guardicore Segmentation 實(shí)現(xiàn)了 152% 的投資回報(bào)率
- 熱門(mén)資源推薦
- 熱門(mén)放大器推薦
- 納芯微推出高抗干擾特性的CAN收發(fā)器NCA1145B-Q1
- 邊緣計(jì)算上新!英特爾借助開(kāi)放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新
- Predibase發(fā)布全球首個(gè)端到端強(qiáng)化微調(diào)平臺(tái)并開(kāi)源
- NVIDIA Omniverse 物理 AI 操作系統(tǒng)擴(kuò)展至更多行業(yè)和伙伴
- NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)
- NVIDIA Blackwell RTX PRO 提供工作站和服務(wù)器兩種規(guī)格,助力設(shè)計(jì)師、開(kāi)發(fā)者、數(shù)據(jù)科學(xué)家和創(chuàng)作人員構(gòu)建代理式 AI 并進(jìn)行協(xié)作
- NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)
- NVIDIA Dynamo 開(kāi)源庫(kù)加速并擴(kuò)展 AI 推理模型
- 摩爾斯微電子攜手萬(wàn)創(chuàng)科技推出尖端Wi-Fi HaLow適配器VT-USB-AH-8108
- NCP551 150 mA CMOS 低 Iq 低壓降穩(wěn)壓器的典型應(yīng)用
- 一個(gè)生日禮物
- L4963、1.5A 開(kāi)關(guān)穩(wěn)壓器的典型應(yīng)用電路
- LTC1563-3、50kHz 寬帶帶通濾波器
- Sg3526 驅(qū)動(dòng) N 溝道功率 MOSFET 的典型應(yīng)用
- 用于微處理器復(fù)位電路的 NCP301LSN46T1 4.6V 電壓檢測(cè)器的典型應(yīng)用
- LT3091IT7 簡(jiǎn)單電纜壓降補(bǔ)償?shù)牡湫蛻?yīng)用
- LT1764EQ SCR 預(yù)穩(wěn)壓器的典型應(yīng)用可在線路變化范圍內(nèi)提供效率
- SEN-15436,SparkFun 環(huán)境光傳感器 - VEML6030 (Qwiic)
- 以太網(wǎng)供電-5 V 2 A輸出的PD轉(zhuǎn)換器,符合IEEE 802.3af協(xié)議標(biāo)準(zhǔn)
- 余承東發(fā)布ADS4.0:4激光雷達(dá)+首發(fā)自研4D雷達(dá)!率先上車(chē)47萬(wàn)元問(wèn)界M9
- 線控技術(shù)驅(qū)動(dòng)汽車(chē)智能化躍遷,安森美全鏈路技術(shù)護(hù)航
- 耐高溫、低損耗! AS1A 系列車(chē)載功率電感新品發(fā)布
- 特斯拉的智駕才是“遙遙領(lǐng)先” 國(guó)產(chǎn)方案就像手電筒
- 歐洲汽車(chē)電動(dòng)化的“斷芯”之痛
- 高階智駕規(guī)模化突圍 | 奇瑞汽車(chē)智能駕駛布局
- 億緯鋰能擬發(fā)行50億元可轉(zhuǎn)債券,用于投建動(dòng)力電池項(xiàng)目
- 廣汽發(fā)布智能科技品牌“星靈智行”
- KAIST開(kāi)發(fā)出新型電解質(zhì)溶劑異丁腈 可15分鐘充滿電動(dòng)汽車(chē)電池
- 英偉達(dá)推出適用于自動(dòng)駕駛汽車(chē)的全棧綜合安全系統(tǒng)NVIDIA Halos
- 有獎(jiǎng)直播:超小型封裝 TI MSPM0 MCU 可優(yōu)化設(shè)計(jì)空間,實(shí)現(xiàn)更多可能
- 預(yù)報(bào)名有獎(jiǎng)直播:煮酒數(shù)創(chuàng)客,看如何讓好創(chuàng)意發(fā)生!
- 挑戰(zhàn)四月 恩智浦MCU開(kāi)發(fā)體驗(yàn)搜集令!
- 【已結(jié)束】直播“戴”“芯”:英飛凌可穿戴設(shè)備保姆級(jí)解決方案
- 免費(fèi)下載|TE 白皮書(shū)《暖通空調(diào)制冷系統(tǒng)中壓力傳感器的重要性》
- 有獎(jiǎng)直播|ST資料中心與通訊網(wǎng)路電源管理解決方案
- 觀看TI無(wú)線連接專(zhuān)場(chǎng)研討會(huì) 下載TI無(wú)線電子書(shū)有禮
- 2019東芝PCIM在線展會(huì):會(huì)一會(huì) 電力領(lǐng)域中的高能晶體管們
- TI SensorTag創(chuàng)意設(shè)計(jì)大賽重磅開(kāi)啟!
- ST AMG SensorTile開(kāi)發(fā)大賽駕到,重磅大獎(jiǎng)與知識(shí)兼得,速來(lái)~
- 上汽合資,實(shí)現(xiàn)量產(chǎn)自動(dòng)駕駛域控制器
- 國(guó)內(nèi)多所高校開(kāi)設(shè)人工智能學(xué)院 能補(bǔ)上人才缺口嗎?
- 中國(guó)首例自主研發(fā)超5千小時(shí)耐久性燃料電池問(wèn)世
- 安森美半導(dǎo)體推出符合AEC-Q100認(rèn)證的圖像傳感器
- 車(chē)輛跟蹤系統(tǒng):隨時(shí)隨地,盡在掌控之中
- 三星電機(jī)/精研科技供應(yīng)商悅安新材于12月16日科創(chuàng)板首發(fā)上會(huì)
- 從PAMiD看射頻前端模塊化的演進(jìn)和未來(lái)
- 聯(lián)想拯救者Pro BOM表揭秘:高通旗艦芯片就是金字招牌
- 臺(tái)積電陳平:這三大元素指明了半導(dǎo)體產(chǎn)業(yè)未來(lái)走向
- 國(guó)產(chǎn)EDA領(lǐng)軍企業(yè),芯和半導(dǎo)體參展了ICCAD 2020
- MCU工程師煉成記——好員工守則
- 請(qǐng)各位看看這個(gè)視頻
- Zedboard編譯Linux內(nèi)核過(guò)程兩三事
- 關(guān)于LSM6DSL的遇到的未解決問(wèn)題
- 國(guó)內(nèi)10個(gè)好玩人卻不多的地方
- TMS320f28335中斷問(wèn)題
- 簡(jiǎn)單說(shuō)說(shuō)依賴(lài)
- EEWORLD大學(xué)堂----樹(shù)莓派 Raspberry Pi 3 Model B 開(kāi)箱實(shí)測(cè) 裝機(jī) + SSH VNC 遠(yuǎn)程登錄
- 【解決】Proteus仿真時(shí)數(shù)碼管動(dòng)態(tài)掃描時(shí)三極管不起作用
- TI DSP定點(diǎn)算術(shù)運(yùn)算之三