NVIDIA創六項人工智能性能記錄
Tensor Core GPU在每一項MLPerf基準測試結果中均實現最佳表現;用戶可通過NGC使用加速堆棧。
在最新公布的業內首套人工智能基準測試中,NVIDIA創下6項人工智能性能記錄。
在谷歌、英特爾、百度、NVIDIA及其他數十家科技行業領軍企業的支持下,新型基準測試套件MLPerf可測定一系列深度學習工作負載。該套件涵蓋了計算機視覺、語言翻譯、個性化推薦以及強化學習任務等領域,旨在成為業內首個客觀的人工智能基準測試套件。
最佳性能表現
NVIDIA在其提交的 6個 MLPerf 基準測試結果中均取得了最佳表現。這些測試涵蓋了多種工作負載和基礎架構規模 – 從單節點上的16顆GPU到跨80節點上的多達640顆GPU。
這些測試分為6大類別,分別為圖像分類、對象實例分割、目標檢測、臨時翻譯、復發性翻譯與推薦系統。NVIDIA并未提交第7類別,即強化學習的基準測試,原因是該類別尚未充分利用到GPU加速。
NVIDIA在語言翻譯測試類別中表現突出
NVIDIA在語言翻譯這一關鍵基準測試類別中表現尤為出色,僅需 6.2 分鐘即完成了Transformer 神經網絡的訓練。關于NVIDIA參與的6項基準測試結果的更多信息,請訪問NVIDIA開發者新聞中心 。
NVIDIA工程師利用NVIDIA DGX系統實現了這些測試結果。該系統包括全球最強大的人工智能系統NVIDIA DGX-2,搭載了16顆完全連接的V100 Tensor Core GPU。
唯一一家參與多達6項基準測試的科技公司
NVIDIA是唯一一家參與多達6項基準測試的科技公司,充分展現出V100 Tensor Core GPU在部署人工智能工作負載方面的通用性。
NVIDIA副總裁兼加速計算總經理Ian Buck表示:“全新基準MLPerf展示了NVIDIA Tensor Core GPU非凡的性能與通用性。我們的Tensor Core GPU擁有高性價比,且可通過各地的云服務提供商及電腦制造商實現供貨,進而幫助世界各地的開發人員在開發過程中的每一個階段推進人工智能的應用。”
一流的人工智能計算需要“全棧式”創新
要想在復雜多樣的計算工作負載中實現優異性能,不僅僅需要出色的芯片。加速計算也不單單與加速器有關,還需要實現全堆棧創新。
NVIDIA堆棧包括NVIDIA Tensor Cores、NVLink、NVSwitch、DGX系統、CUDA、cuDNN、NCCL、經過優化的深度學習框架容器以及NVIDIA軟件開發套件。
超高易用性
NVIDIA的人工智能平臺是最便捷且高性價比的選擇。Tensor Core GPU可通過各地的云服務提供商及電腦制造商實現供貨。
高性價比的選擇
借助售價僅為2,500美元的超強桌面級GPU - NVIDIA TITAN RTX,用戶在桌面上也可實現相同的Tensor Core GPU強大功能。如果按照3年使用期來計算,該GPU每小時的費用僅相當于幾美分。
通過NVIDIA GPU Cloud (NGC) 云容器注冊,用戶可持續更新這些軟件的加速堆棧。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













