UALink規范發布:挑戰英偉達AI統治的開始
芝能智芯出品
Ultra Accelerator Link(UALink)1.0規范正式發布,人工智能(AI)和高性能計算(HPC)領域開始有新的競爭。
由AMD、Broadcom、Google、Intel等行業巨頭聯合推動的UALink,打造一個開放、高速、低延遲的互連標準,直接挑戰英偉達的NVLink技術霸主地位。UALink 1.0支持每通道200 GT/s的帶寬,連接多達1024個加速器,具備低成本、可擴展和高安全性的特性,為AI加速器生態系統注入新的競爭活力。
我們將從技術創新和市場競爭兩個維度深入分析UALink的意義,探討其對AI產業格局的潛在影響。

Part 1
UALink的技術創新與優勢
UALink的誕生源于AMD、Broadcom、Intel等公司對英偉達NVLink專有技術的集體應對。
英偉達通過NVLink和NVSwitch構建了高效的GPU互聯生態,尤其在Blackwell NVL72等機架級解決方案中展現了強大的性能。然而,NVLink的封閉性限制了其他廠商的參與,抬高了系統集成成本。
UALink通過開放標準打破這一壁壘,允許不同廠商的加速器(如AMD Instinct GPU、Intel Gaudi)無縫協作,降低了數據中心部署的復雜性和成本。
這種開放生態的構建,不僅為系統集成商和數據中心運營商提供了靈活性,也為中小型AI硬件廠商創造了參與競爭的機會。
UALink規范發布:挑戰英偉達AI統治的開始
● UALink 1.0的協議棧由物理層、數據鏈路層、事務層和協議層組成,針對AI和HPC負載進行了深度優化。
◎ 物理層:基于標準以太網組件(如200GBASE-KR1/CR1),通過改進前向糾錯(FEC)和碼字交織技術,顯著降低延遲,同時保持與現有以太網生態的兼容性。
◎ 數據鏈路層:采用64字節到640字節的flit打包機制,結合循環冗余校驗(CRC)和可選重試邏輯,確保數據傳輸的可靠性和高效性。◎ 事務層:通過壓縮尋址和直接內存操作(讀、寫、原子事務),實現高達95%的協議效率,優化了跨加速器的內存訪問,特別適合AI訓練和推理中對低延遲的嚴苛要求。◎ 協議層:支持UALinkSec硬件級加密和可信執行環境(如AMD SEV、Intel TDX),為多租戶數據中心提供安全隔離和機密計算能力。

這種分層設計在保持高性能的同時,簡化了協議復雜度,相較于PCI-Express(PCIe)或CXL,UALink在帶寬和延遲上更具優勢,尤其適合大規模AI計算集群。
UALink支持連接多達1024個加速器,覆蓋1到4個機架,單通道雙向帶寬達200 GT/s,四通道配置下可達800 GT/s。
這種規模化能力使其能夠應對日益增長的AI模型需求,例如大型語言模型(LLM)的訓練和推理任務。
此外,UALink的往返延遲在64B/640B負載下低于1微秒,端口到端口跳變延遲約為100-150納秒,接近PCIe交換機的性能,遠優于傳統以太網。這種低延遲特性對于構建確定性性能的AI計算Pod至關重要。

UALink的設計注重能效,其交換機的功耗僅為同等以太網ASIC的1/3到1/2,每個加速器可節省150-200瓦的功耗。更小的芯片面積和更低的功耗不僅降低了硬件成本,還減少了數據中心的電力和冷卻開支,從而優化了總體擁有成本(TCO)。
這對于超大規模云服務提供商(如Google、Microsoft)尤為重要,他們需要平衡性能與運營成本。
Part 2
UALink挑戰英偉達的生態壁壘
英偉達在AI加速器市場的統治地位不僅源于其強大的GPU硬件,還得益于NVLink、NVSwitch和CUDA軟件生態的協同作用。
例如,Blackwell NVL72機架通過NVLink連接72個GPU,Pod級擴展支持576個GPU,而即將推出的Vera Rubin平臺將進一步提升單機架GPU數量至144個。
相比之下,UALink 1.0理論上支持1024個加速器的Pod規模,展現了更大的擴展潛力。
然而,英偉達的生態壁壘并非僅靠硬件互連,CUDA的廣泛采用和優化工具鏈使其在開發者社區中根深蒂固。
UALink聯盟需要不僅在硬件層面競爭,還需推動軟件生態(如ROCm、oneAPI)的成熟,以吸引開發者從英偉達平臺遷移。

UALink聯盟的成員涵蓋了芯片設計(AMD、Intel、Broadcom)、云服務(Google、Microsoft、Meta)、網絡設備(Cisco)和系統集成(HPE)等多個領域。
這種廣泛的行業支持為UALink的快速落地提供了基礎。例如,Synopsys已推出UALink IP控制器和驗證IP,Astera Labs和Broadcom也計劃生產UALink交換機。
然而,聯盟內部的利益協調可能是一大挑戰。例如,Google和Meta專注于定制加速器(如TPU),而AMD和Intel則希望推廣通用GPU,成員之間的優先級差異可能導致標準演進的復雜性。
此外,英偉達的缺席使得UALink短期內難以撼動其市場主導地位,尤其是在高端AI訓練市場。
UALink 1.0規范的發布標志著技術開發的重大進展,但從規范到商用產品通常需要12-18個月。聯盟預計首批UALink設備將于2026年面世,而英偉達的NVLink 6.0和Rubin Ultra平臺可能在2027年進一步提升性能。
這意味著UALink需要在有限的時間窗口內證明其性能和成本優勢,以搶占市場份額。
市場接受度將取決于實際部署中的表現,例如是否能無縫集成現有數據中心基礎設施,以及是否能顯著降低AI訓練和推理的總體成本。
此外,中小型企業對開放標準的接受度可能高于依賴英偉達生態的大型客戶,這為UALink提供了切入市場的機會。
UALink與Ultra Ethernet Consortium(UEC)的合作是其戰略的重要組成部分。
UEC致力于優化以太網以滿足AI和高性能計算的規模化需求,而UALink專注于Pod內加速器的高速互連。兩者結合有望形成“規模內+規模外”的完整解決方案。例如,UALink可用于連接8-128臺服務器的Pod,而Ultra Ethernet可實現跨Pod的擴展。
這種協同效應增強了UALink的生態競爭力,但也增加了技術整合的復雜性,需要聯盟在標準制定和產品開發中保持高效協作。
小結
UALink 1.0規范的發布是AI產業競爭格局演變的象征。作為一個開放標準,UALink通過高速、低延遲和低成本的互連技術,為AMD、Intel、Google等公司挑戰英偉達的AI統治提供了關鍵武器。
協議棧的優化設計、可擴展性和安全性為構建下一代AI計算Pod奠定了基礎,同時與Ultra Ethernet的協同潛力進一步增強了其市場前景。聯盟需要在軟件生態、產品落地和市場推廣上持續發力,尤其是在2026年的關鍵時間窗口內證明其價值。
從更廣義的角度看,UALink的出現反映了AI產業對開放性和多樣化的需求,AI訓練和推理需求的持續增長,UALink與NVLink的競爭會立即打響。
原文標題 : UALink規范發布:挑戰英偉達AI統治的開始
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













