- 首頁
-
產品中心
產品中心
覆蓋數據實時處理與智能分析全生命周期
- 數智一體化交付
- 云能平臺 AI+Data系列一體機
- 組網系列
- GPU Direct 和RDMA
- 解決方案
- 生態合作
- 產品試用
- 新聞中心
- 關于我們
發布時間:2024-12-11 | 閱讀:
2月9日晚間,國家市場監督管理總局依法對英偉達公司開展反壟斷立案調查的消息引發廣泛關注。此次調查主要是由于2019年英偉達收購以色列高速網絡互聯設備廠商邁絡思(Mellanox)引發。分析當時市場監督管理總局要求英偉達、邁絡思和集中后實體履行的5條公開義務,其核心在于邁絡思RDMA產品與英偉達GPU 不得強制捆綁產品,必須允許混合組網,并依據公平、合理、無歧視原則繼續供應相關產品。
反壟斷調查的核心:RDMA混合組網
2019年 3 月 10 日,英偉達以 69 億美元的巨額資金將以色列邁絡思科技有限公司納入麾下,使其成為全資子公司。
根據《反壟斷法》以及相關規定,即使并購案的雙方都是外國公司,但只要他們的年收入在全球超過100億元人民幣,在中國市場超過4億元人民幣,那么相關收購案就將會被納入中國商務部的監管當中。
英偉達在GPU芯片領域獨占鰲頭,在2019年的營收已達到117.2億美元。邁絡思作為一家在全球范圍內為服務器和存儲提供端到端Infiniband和以太網互聯解決方案的領軍企業,其2015年在全球InfiniBand市場上的占有率達到80%。中國作為全世界最大的市場之一,英偉達和邁絡思在中國有大量的業務。這一收購案無疑需要被中國反壟斷部門監管。
2019年4月24日,國家市場監督管理總局收到上述收購的經營者集中反壟斷申報。2020年4月,國家市場監督管理總局依法附加限制性條件批準英偉達收購邁絡思。
根據申報方提交的附加限制性條件承諾方案,市場監督管理總局要求英偉達、邁絡思和集中后實體履行如下義務:
1.向中國市場銷售英偉達 GPU 加速器與邁絡思高速網絡互聯設備時,不得以任何方式強制進行搭售,或者附加任何其他不合理的交易條件;不得阻礙或限制客戶單獨購買或使用上述產品;不得在服務水平、價格、軟件功能等方面歧視單獨購買上述產品的客戶。
2.依據公平、合理、無歧視原則向中國市場繼續供應英偉達 GPU 加速器、邁絡思高速網絡互聯設備和相關軟件、配件。
3.繼續保證英偉達 GPU 加速器與第三方網絡互聯設備、邁絡思高速網絡互聯設備與第三方加速器的互操作性。
4.繼續保持邁絡思高速網絡互聯設備點對點通信軟件和集合通信軟件的開源承諾。
5.對第三方加速器和網絡互聯設備制造商的信息采取保護措施。
英偉達在收購邁絡思后,涉嫌并未完全履行附加的限制性條件,特別是在中國市場上的銷售行為可能涉及捆綁銷售和歧視性定價等壟斷行為。市場監管總局此次立案調查,正是為了打破這種可能的壟斷局面,促進市場競爭,保護消費者權益。
允許混合組網,即允許其GPU加速器和邁絡思高速網絡互聯設備與其他廠商的產品進行兼容和互操作。不僅有助于維護市場公平競爭,也為國產RDMA技術廠商公平公正參與市場競爭提供了友好環境。柏睿數據RDMA解決方案正是基于混合組網的理念,不僅支持RDMA技術,還能夠利用原有的TCP網絡,實現了技術的兼容性和靈活性。這種方案不僅提高了數據傳輸的速度和效率,還降低了對特定硬件的依賴,為用戶提供了更多的選擇和便利。
RDMA/RoCE與邁絡思InfinityBand
RDMA技術包含多種協議,其中InfiniBand、iWARP和RDMA over Converged Ethernet(RoCE)是三種主要的協議。
InfiniBand(簡稱 IB),直譯過來就是“無限帶寬”。IB是一種專為高性能計算(HPC)和數據中心設計的網絡互聯技術,其率先引入了RDMA協議。
上世紀90年代,業界普遍認為一些更強大的計算機正在接近PCI(電腦中的設備互連標準)總線的瓶頸。IB技術也是被設計用來替代內部PCI總線和外部以太網絡。康柏、戴爾、惠普、IBM、Intel、微軟、Sun等180多家IT巨頭共同發起成立InfiniBand行業協會(IBTA),研究新的替代技術來取代PCl,解決PCI總線傳輸瓶頸的問題。在2000年,InfiniBand架構規范的1.0版本正式發布。
大量初創公司隨之涌現,其中就包括以色列的邁絡思。其由幾名前英特爾公司和伽利略公司員工于1999年創建。2001年他們推出了自己的首款InfiniBand產品。
進入 21 世紀以來,隨著云計算、大數據的不斷普及,數據中心獲得了高速發展。而 InfiniBand作為數據中心里的一項關鍵技術高歌猛進,市場份額不斷提升。Mellanox憑借將IB用于高性能計算、端到端設備等重大戰略決策,逐漸成為了InfiniBand市場的領導者。
IB雖然可以提供最佳性能,但自定義了從鏈路層到傳輸層的整套規范,需要專用網卡和交換機支持,不兼容以太網且價格昂貴。
面對IB的迅猛發展,以太網也在積極應對。2010年4月,IBTA發布了RoCE技術,即基于融合以太網的遠程直接內存訪問,將InfiniBand中的RDMA技術移植到了以太網上。2014年,RoCE v2版本發布,使以太網大幅縮小了與InfiniBand之間的技術性能差距。
RoCE消耗很少的CPU負載,在數據中心橋接以太網中利用優先流控制(PFC)來達到網絡的無損連接。由于RoCE與現有以太網設備的兼容性,這些解決方案也更容易被用戶接受和部署。
最新的統計數據顯示,使用RoCE方案可以將TCO(總擁有成本)降低超過50%,并且能夠支持100萬張GPU的擴展能力,而IB方案則只能支持48000張GPU。這種高擴展性使得以太網RDMA成為支撐未來大規模AI集群的理想選擇。
柏睿RDMA迎來發展機遇
英偉達在中國遭遇反壟斷調查維護了市場公平競爭原則。隨著RoCE技術的不斷發展,國產RDMA迎來了難得的發展機遇。柏睿數據的RDMA技術基于RoCE協議,支持混合組網,兼容現有以太網設備,為客戶AI基礎設施提供靈活、經濟、高效的技術支持。
柏睿數據通過將RDMA封裝成Socket接口,使得開發人員可以使用熟悉的Socket編程模型,而無需直接處理RDMA的復雜性。這一創新簡化了RDMA的應用門檻,可以更容易地與現有的應用程序和系統集成,提高了可移植性、兼容性和易維護性。近期在一個大規模 400G RoCE 集群測試結果顯示,使用柏睿 RDMA Socket 可以大大提升網絡響應速度和帶寬傳送能力。
柏睿數據將RDMA技術與全內存分布式計算引擎相結合。RDMA進行的數據傳輸,有效支持不同計算節點之間的快速協作;全內存分布式計算則可以確保數據在多個節點之間的共享和快速處理,極大提高了數據傳輸的速度和效率,在高性能工業仿真等領域發揮出巨大作用。
隨著AIGC大模型應用落地,各行業對高性能計算和智能計算的需求井噴,RDMA技術正在成為AI網絡架構中的重要支柱。數據中心中已安裝的以太網交換機端口數量超過了4億個。鑒于其廣泛的存在,以太網將在AI/ML網絡中發揮越來越大的作用,未來會有越來越多的RDMA操作通過以太網完成。柏睿數據將繼續加大在RDMA技術研發和應用落地方面的投入,推出更多具有競爭力的產品和解決方案,為用戶提供更加高效、便捷的數據傳輸服務。