亞馬遜推出用于人工智能部署的AWS Inferentia芯片
亞馬遜宣布推出Inferentia,這是由AWS設計的芯片,專門用于部署帶有GPU的大型AI模型,該芯片將于明年推出。
Inferentia將與TensorFlow和PyTorch等主要框架協同工作,并與EC2實例類型和亞馬遜的機器學習服務SageMaker兼容。
“你將能夠在每個芯片上獲得數百個TOPS; 如果你愿意的話,你可以將它們捆綁在一起以獲得數千個TOPS,“AWS首席執行官Andy Jassy今天在年度re:Invent會議上表示。
Inferentia還將與Elastic Inference合作,這是一種加速使用GPU芯片部署AI的方法,這也是今天宣布的。
彈性推理適用于1到32 teraflops的數據范圍。Inferentia檢測主要框架何時與EC2實例一起使用,然后查看神經網絡的哪些部分將從加速中受益最多; 然后將這些部分移動到彈性推理以提高效率。
Jassy說,今天推出AI模型所需的兩個主要流程是培訓和推理,推理占了近90%的成本。
“我們認為運營成本可以通過Elastic Inference節省75%的成本,如果你將Inferentia放在其上,這是成本的另一個10倍的提升,所以這是一個重大的改變游戲規則,這兩個推出推斷我們的客戶,“他說。
Inferentia的發布是在周一首次亮相的一款芯片之后由AWS專門用于執行通用工作流程。
Inferentia和Elastic Inference的首次亮相是今天發布的幾個AI相關公告之一。今天還宣布:推出AWS市場,供開發人員銷售他們的AI模型,以及DeepRacer League和AWS DeepRacer汽車的推出,該 汽車在模擬環境中使用強化學習訓練的AI模型上運行。
今天預覽中還提供了許多不需要預先知道如何構建或訓練AI模型的服務,包括Textract用于從文檔中提取文本,Personalize用于客戶建議,以及Amazon Forecast,這是一種生成私有預測模型的服務。
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













