在2020年全球數字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA? Mellanox? 400G InfiniBand產品,這是全球第一代400Gb/s網速的端到端網絡解決方案,可為全球的AI和HPC用戶提供最快的網絡互連性能,同時將計算、可編程性和軟件定義三種技術成功地融于一體,成為業界領先的軟件定義、硬件加速的可編程網絡,為全球的科研人員和工程人員設計新一代計算系統和提升應用性能提供了新的思路。
NVIDIA Mellanox InfiniBand NDR產品是第7代的InfiniBand產品,利用100Gb/s的PAM4 Serdes技術, 實現了400Gb/s的單端口傳輸帶寬, 是上一代產品的兩倍, 同時通過添加更多、更強大的加速引擎,實現了更強大的計算和通信能力。
NVIDIA Mellanox NDR 400G InfiniBand產品系列
“Speed Of Light”是關于NDR InfiniBand技術的第一個特征,通過加倍的帶寬、更快的包處理能力(Message Rate), 讓基于RDMA、GPU Direct RDMA和GPU Direct Storage等先進通信技術的應用性能得到了進一步提升。InfiniBand網絡是天然的SDN網絡,可以讓用戶根據應用的屬性來選擇各種不同的網絡拓撲,以達到最優的性能,如Fat-Tree、DragonFly+、各種Torus等。如通過DragonFly+網絡拓撲可以在4個交換機Hop內達到一百萬個節點的同時通信,這個規模遠遠超出了E級機、甚至10E級機或百E級機需要的規模;同時其天然的SDN屬性也讓動態路由和網絡擁塞控制變得更容易實現。InfiniBand動態路由已經被廣泛地應用到各種網絡拓撲當中,成為優化通信性能的關鍵手段,如美國橡樹林國家實驗室的Summit超級計算機就通過動態路由將超算中心全網的通信效率從60%提升到了96%。NDR InfiniBand交換機在1U空間內可以支持64個400Gb/s的端口或128個200Gb/s的端口,是上一代交換機端口密度的3倍;它還將框式交換機系統的聚合雙向吞吐量提高了5倍,達到1.64 petabits/s,是全球端口數最多、交換容量最大的交換機。
硬件加速是InfiniBand網絡的最大特色,隨著越來越多的加速引擎被添加到InfiniBand硬件中來,進一步加大了其相對于其它網絡技術的領先性。如NDR InfiniBand實現了對于業界最頭疼的All2All和Allreduce通信的硬件卸載,能讓MPI通信的性能提升四倍。NDR InfiniBand對于MPI Tag Matching的硬件卸載,實現了1. 8倍的MPI通信性能提升。NDR InfiniBand可以實現對于NVMeoF的全面卸載, NVMeoF的Target卸載可以讓存儲系統在幾乎不消耗Target端CPU的前提下達到數以百萬級的IOPS,NVME SNAP可以實現對于NVMeoF的Initiator端的卸載,同時可以將InfiniBand網絡模擬成NVMe磁盤提供給主機CPU,可以解決目前很多OS還沒有NVMeoF的Initiator支持的問題,實現了對任何OS, 無論是虛擬化還是物理機的全面NVMeoF的支持;InfiniBand FIO SNAP可以實現對于文件存儲的本地模擬,讓任何OS都可以享受最先進的分布式文件存儲系統的性能優勢。
InfiniBand SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技術徹底消除了MPI或者NCCL的Allreduce操作中的多打一通信帶來的Incast Burst問題,在保證所有端口全線速、共計12.8Tb/s或25.6Tb/s的數據輸入的前提下,實現在交換機上的Allreduce、Barrier、Reduce和Broadcast計算,在NDR交換機上更是實現了相比上一代交換機32倍的計算性能提升。InfiniBand SHIELD (Self-Healing) 技術實現了網絡中鏈路故障的自修復,讓網絡無需等待管理軟件的參與來恢復鏈路故障,實現了比傳統的軟件故障恢復快千倍以上的性能,讓應用不再受困鏈路故障的干擾,提升應用的性能。
InfiniBand安全卸載是面向Cloud Native的應用場景,InfiniBand已經得到了Open Stack的官方軟件支持,通過自帶的硬件IPSec、TLS、AES、Root of Trust等功能,可以讓數據不論是在網絡中流動時,還是在向存儲中落盤時都能以線速性能得到加解密,實現了在虛擬化環境或者在容器化環境中的安全保障。
軟件可編程讓InfiniBand的應用場景得到了進一步的延伸,可編程的NDR InfiniBand不僅可以讓用戶處理數據的header,還可以對于數據的數據路徑進行操作,如用戶可以自定義規則對于數據路徑進行操作;或是對于數據直接在網絡中進行預處理而無需送到CPU做預處理。用戶還可以對于數據的通信特征進行提取、然后利用AI技術對其進行訓練,得到不同應用數據的通用通信特征,如果發現有異常通信信息,可以向管理員主動發出預警。
NVIDIA Mellanox NDR 400G InfiniBand亮點
NDR InfiniBand以其優異的性能和靈活廣泛的使用場景吸引了眾多的合作伙伴一起共建生態系統,包括Atos、戴爾科技、富士通、浪潮、聯想和SuperMicro等服務器廠商,以及DDN、IBM Storage等存儲廠商。各家公司都已開始研發其新一代產品,實現對于NDR InfiniBand的支持。而包括微軟Azure公有云、美國Los Alamos國家實驗室、歐洲Jülich超算中心等全球各頂級用戶都紛紛表示,期待能盡快應用NDR InfiniBand到他們的業務中去,享受NDR的技術優勢。
NVIDIA網絡高級副總裁Gilad Shainer表示: “我們AI客戶最重要的工作就是處理日益復雜的應用程序,這需要更快速、更智能、更具擴展性的網絡。NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智能加速引擎,幫助HPC、AI和超大規模云基礎設施以更低的成本和復雜性,實現無與倫比的性能。”
E級AI和HPC時代已經來臨,同時帶來新的挑戰,軟件定義、硬件加速、面向網絡計算的可編程NDR InfiniBand產品將于2021年第二季度提供樣品。NDR產品的出現,將會大幅提升E級AI和HPC系統的性能和效率,簡化系統的管理和操作,降低系統的TCO,進而保護數據中心的投資。
上一篇:十四五芯藍圖:推動數字化發展,攻克關鍵核心技術
下一篇:Qorvo多重時間可編程電源管理 IC,可減小尺寸,讓系統更可靠
推薦閱讀
史海拾趣
隨著業務的發展,AirBorn開始將目光投向全球市場。公司積極參與國際電子展會,與全球各地的客戶建立合作關系。同時,AirBorn還加大了對研發和生產設備的投入,提升產品質量和生產效率。這些舉措使得AirBorn的產品在全球范圍內贏得了良好的聲譽,公司也逐漸成長為一家具有全球影響力的電子連接器制造商。
為了進一步擴大市場份額,Curtis Industries公司積極拓展市場布局。公司在全球范圍內設立了多個生產基地和研發中心,以便更好地滿足不同地區客戶的需求。同時,公司還加強了與上下游企業的合作,形成了完整的產業鏈。這些舉措不僅提升了公司的產能和研發實力,還為公司帶來了更多的商業機會。
在科技創新的推動下,艾華集團的產品逐漸在國內外市場上嶄露頭角。公司不僅在國內市場上取得了顯著成績,還積極拓展海外市場,產品遠銷歐美、東南亞等地區。同時,艾華集團也注重品牌建設,通過提升產品品質、加強售后服務等方式,不斷提升品牌影響力和美譽度。
面對電子行業日益激烈的競爭和不斷變化的市場需求,Continental Industries積極應對挑戰。公司加強了對市場趨勢的研究和分析,不斷調整產品結構和市場策略。同時,公司還加大了對新技術和新材料的研發力度,努力提升產品的競爭力和附加值。
Hendon Semiconductors在能源管理和照明控制領域也有著顯著的成就。公司開發了一系列高效、可靠的能源管理解決方案和照明控制產品,廣泛應用于智能家居、商業建筑和工業自動化等領域。這些解決方案不僅幫助客戶降低了能耗和運營成本,還提高了能源使用效率和環境可持續性。通過不斷創新和優化產品設計,Hendon Semiconductors在能源管理和照明控制市場上贏得了廣泛的認可。
Hendon Semiconductors的起源可以追溯到上世紀90年代,當時它是Philips半導體在澳大利亞的一個分支機構。1997年,隨著業務重組和戰略調整,該分支機構轉變為獨立運營的公司,并更名為Integrated Electronic Solutions Pty. Ltd。這一轉變標志著Hendon Semiconductors在電子設計與制造領域邁出了重要一步。通過繼承Philips半導體的技術遺產和市場資源,Hendon Semiconductors迅速在行業內站穩腳跟,并開始了其自主發展的道路。
在我的程序中使用memcpy除了點問題,pBufOut 是一個BYTE的指針,pbuf是局部變量的數組, BYTE pbuf[40]; memcpy( pBufOut, pbuf + 3, 32 ); 執行memcpy后調試信息就出來一大堆: Data Abort: Thread=8fc7e550 Proc=89a8ca60 \'OwireTest.exe\' ...… 查看全部問答∨ |
|
在調EEPROM(IIC),板子上電后第一次運行程序,可以正常運行,但是,再重新下載一次程序再運行,Serial Bus一直處于忙狀態,無法進行正常讀寫,這是為什么 … 查看全部問答∨ |
main中的raw_memcpy((void *)0, (void *)(exception_vector), 128) 我在main函數中看到這個函數 raw_memcpy((void *)0, (void *)(exception_vector), 128); 有點不理解這個的意思 這里的"0"表示的是什么? 最終把什么東西復制到了"0"處? 麻煩回答一下啊… 查看全部問答∨ |