近日,DeepSeek發布Janus Pro模型,其超強性能和高精度引起業界關注。英特爾? Gaudi 2D AI加速器現已針對該模型進行優化,這使得AI開發者能夠以更低成本、更高效率實現復雜任務的部署與優化,有效滿足行業應用對于推理算力的需求,為AI應用的落地和規模化發展提供強有力的支持。

作為一款創新性的 AIGC模型,DeepSeek Janus模型集成了多模態理解和生成功能。該模型首次采用統一的Transformer架構,突破了傳統AIGC模型依賴多路徑視覺編碼的限制,實現了理解與生成任務的一體化支持。在此基礎上,Janus Pro通過優化訓練策略和擴展模型規模,顯著提升了文生圖等功能的性能與穩定性,并提供了10億參數和70億參數兩個版本,在性能與精度上展現了較強的競爭力。

在Janus Pro統一的Transformer架構下,文生圖模型的吞吐量高低已經從依賴加速器的高算力向充分利用HBM內存高帶寬和大容量轉換。英特爾? Gaudi 2D憑借 2.45TB/秒的高帶寬和 96GB HBM 大容量內存,為 Janus Pro 模型提供了強大的計算支持,使其在生圖批處理任務中,隨著批量大小(Batch Size)的增加,吞吐性能得到顯著提升,大幅縮短任務處理時間。
與此同時,結合英特爾Optimum-Habana 框架的優化,英特爾? Gaudi 2D顯著提升了文生圖任務的吞吐性能和推理效率,僅需約 10 秒即可生成16張高質量的圖片,性能表現卓越。而且,開發者僅需調整數行代碼,即可實現這一結果,極大降低了開發門檻和遷移成本,為 AI 應用的高效部署提供便利。

此外,DeepSeek的蒸餾模型在至強和Gaudi平臺上也得到了支持,能夠為客戶創造更好的總體擁有成本(TCO),推動AI的普惠。
一直以來,英特爾始終秉承開放的態度,并通過軟硬件相結合的方式推動AI應用落地。目前,英特爾豐富的AI產品組合,包括英特爾?至強?處理器、英特爾?酷睿? Ultra處理器和英特爾銳炫?顯卡等,已經針對業界超過500個開源AI模型提供支持,廣泛涵蓋DeepSeek、Llama 3.1和通義千問等。同時,英特爾深耕開放生態,不僅以開放生態系統軟件實現針對性優化,也通過打造企業AI開放平臺(OPEA)為這些模型提供支持。
關鍵字:英特爾 Gaudi AI 加速器
引用地址:
英特爾Gaudi 2D AI加速器為DeepSeek Janus Pro模型提供加速
推薦閱讀最新更新時間:2025-04-24 00:40
英特爾Gaudi 2D AI加速器為DeepSeek Janus Pro模型提供加速
近日,D eepSeek發布Janus Pro模型,其超強性能和高精度引起業界關注。 英特爾? Gaudi 2D AI加速器現已針對該模型進行優化,這使得AI開發者能夠以更低成本、更高效率實現復雜任務的部署與優化,有效滿足行業應用對于推理算力的需求,為AI應用的落地和規模化發展提供強有力的支持。 作為一款創新性的 AIGC模型,DeepSeek Janus模型集成了多模態理解和生成功能。 該模型首次采用統一的Transformer架構,突破了傳統AIGC模型依賴多路徑視覺編碼的限制,實現了理解與生成任務的一體化支持。在此基礎上,Janus Pro通過優化訓練策略和擴展模型規模,顯著提升了文生圖等功能的性能與穩定性,并提供
[網絡通信]
TI首次在汽車SoC中加入專用AI加速器,算力驚人
德州儀器(TI)首次在其汽車SoC添加了一個專用深度學習加速器。TDA4VM的開發套件以及預生產設備已經可用。預計將于2020年下半年開始量產。 從這一舉動,我們可以看到深度學習技術在汽車ADAS系統中正日益普及。 一、TI中端ADAS處理器首次包含專用AI加速器 新的深度學習模塊基于TI全新的C7x DSP IP以及其內部開發的矩陣乘法加速器。 TDA4VM是Jacinto 7系列產品中首批推出的兩個SoC之一,它結合了傳感器預處理和數據分析功能,可處理800萬像素前置攝像頭系統的輸入。 另外,TDA4VM可以同時處理4-6個300萬像素攝像機,這些攝像機還能與雷達、激光雷達和超聲波傳感器的輸入同時工作。
[汽車電子]
2024年巴黎奧運會正式開幕,英特爾人工智能平臺助力呈現8K超高清直播
該直播由英特爾至強可擴展處理器和其他硬件提供支持 也許在此之前,在家中以8K分辨率這一最高級別的視頻質量觀看奧運賽事直播,近乎是一個難以完成的事情。在2024年巴黎奧運會上,英特爾將呈現與奧林匹克廣播服務公司(OBS)及全球眾多廣播公司、合作伙伴長期協作的成果,將這一想法變為現實。 作為2024年巴黎奧運會和殘奧會官方全球人工智能平臺合作伙伴,英特爾將推出基于英特爾硬件和軟件的一系列創新人工智能體驗,為來自世界各地的體育愛好者、組織方、運動員和觀眾帶來不同以往的參與體驗。 在整個2024年巴黎奧運會期間,經人工智能優化的廣播服務器將對奧林匹克廣播服務公司(OBS)生成的8K直播信號進行編碼和壓縮,并通過開放的互聯網渠道
[網絡通信]
創意無限!英特爾人工智能創新應用大賽激發AI PC體驗的更多可能
5月11日, 英特爾人工智能創新應用大賽總決賽暨頒獎典禮在北京舉辦。 英特爾通過搭載英特爾?酷睿?Ultra處理器的AI PC設備和軟件工具套件、開放的生態系統,幫助開發者在AI PC上進行創新應用開發并推動相關應用落地,讓最終用戶能夠在PC上體驗到由AI技術帶來的生產力躍升。 在歷時五個月的角逐后,來自個人賽道和企業賽道的2120支團隊中,共有30支團隊的優秀作品脫穎而出并晉級總決賽,這些作品新穎、實用且可落地,覆蓋互聯網、教育、醫療、農業、建筑、法律、零售、文旅、工業、能源、游戲、影視、廣告等多個領域。其中,來自個人賽道的VidBot團隊和企業賽道的熊貓AI團隊分獲其賽道的一等獎。 英特爾酷睿Ultra處理
[網絡通信]
讓AI無處不在,英特爾以AI平臺創新助奧運釋放科技魅力
摘要:英特爾公布以人工智能驅動的解決方案,為奧運會和殘奧會帶來創新體驗。 2024年4月17日,英特爾正式公布針對2024年巴黎奧運會和殘奧會的計劃。在奧運會這一全球舞臺上,英特爾將部署由英特爾處理器賦能的人工智能技術,讓AI無處不在。 作為2024年巴黎奧運會和殘奧會官方全球人工智能平臺合作伙伴,英特爾將推出基于英特爾硬件和軟件的一系列創新人工智能體驗,為來自世界各地的體育愛好者、組織方、運動員和觀眾帶來不同以往的參與體驗。 人工智能應用的主要領域包括: ?沉浸式運動體驗讓體育愛好者得以感受用于評估運動員潛能的創新技術; ?助力本屆奧運會呈現端到端8K超高清直播; ?在部分奧運會和殘奧會設施中推進無障
[網絡通信]
自駕車AI芯片NVIDIA多獲關注與掌聲 英特爾認為產品被錯評
英特爾(Intel)執行長Brian Krzanich在本屆美國洛杉磯車展(AutoMobility LA)上,強調英特爾旗下由Mobileye所開發的自駕車芯片EyeQ 5,比NVIDIA近期新發表的Drive PX Xavier系統單芯片(SoC)在深度學習(DL)效能表現上高出1倍以上,對此英特爾自駕車解決方案架構長兼首席工程師Jack Weast表示,英特爾不是特別會夸耀自家芯片性能的公司,但隨著近來在自駕車芯片性能比較的討論戰火升溫,英特爾有必要為自家芯片性能做出說明,因英特爾對于被錯誤評比已感到厭倦。 根據科技網站EE Times及Auto Connected Car報導,Weast對于英特爾競爭對手及媒體經常不正
[半導體設計/制造]
協處理器作為獨立加速器提升用戶體驗
當今的消費者對技術的要求日益提升,這一點在用于與設備進行互動的界面技術上體現得尤為明顯。人們對包括手機、車載電子、家用網絡和辦公環境下的設備要求越來越高,要求它們能夠融入更易操作的、更直觀的用戶界面,以更貼切反映人與人之間的互動關系。 在每一個新的產品周期中,設計人員都倍感壓力,要設計出操作更加精確、用戶界面更加直觀的產品。近年來,繼觸屏技術逐漸普及到包括電話、平板電腦、顯示器、銷售點解決方案、ATM和查詢機等設備之后,語音識別技術正在快速成為驅動產品創新與運用的下一代用戶界面技術。語音識別,甚至是手勢與影像識別,成為各種工作與個人設備的標準配備只是個時間問題。由于語音識別技術在某種程度上受制于 嵌入式 應用的發展,因此其至今
[電源管理]
快速晶閘管在加速器電源系統中的應用
摘要:介紹了快速晶閘管在所研制的加速器電源系統中的應用,分析并解決了快速晶閘管的觸發驅動、過壓過流保護等問題。
關鍵詞:快速晶閘管;加速器電源;脈沖功率技術
1? 引言
??? 脈沖功率技術是一種能量密度“壓縮”技術,它通過開關的瞬時導通把較長時間內儲存的能量在很短的時間(μs或ns量級)內釋放出來,形成幅度達數十kA甚至數百kA的強電流脈沖。脈沖功率技術對放電開關的要求是開關的動作速度必須很快,額定電流大,導通時開關的導通電阻要小。早期采用汞引燃管,火花隙等作放電開關。隨著電力電子技術的發展,先是出現了普通晶閘管,但普通晶閘管的開通時間和關斷時間都很長,特別是當負載為感性時,普通晶閘管的開通時間甚至需要
[電源管理]