世界今亮點!Habana Gaudi2性能穩(wěn)超英偉達A100,助力實現(xiàn)高效AI訓練
MLPerf測試結果驗證了Gaudi2在ResNet和BERT模型訓練時間上的優(yōu)勢
近日,英特爾宣布Habana? Gaudi?2深度學習處理器在MLPerf行業(yè)測試中表現(xiàn)優(yōu)于英偉達A100提交的AI訓練時間,結果突顯了5月在英特爾On產(chǎn)業(yè)創(chuàng)新峰會上發(fā)布的Gaudi2處理器在視覺(ResNet-50)和語言(BERT)模型上訓練時間的優(yōu)勢。
(相關資料圖)
英特爾公司執(zhí)行副總裁兼數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理 Sandra Rivera表示:“非常高興能與大家分享Gaudi 2在MLPerf基準測試中的出色表現(xiàn),我也為英特爾團隊在產(chǎn)品發(fā)布僅一個月取得的成就感到自豪。我們相信,在視覺和語言模型中提供領先的性能能夠為客戶帶來價值,有助于加速其AI深度學習解決方案。”
借助Habana Labs的Gaudi平臺,英特爾數(shù)據(jù)中心團隊能夠專注于深度學習處理器技術,讓數(shù)據(jù)科學家和機器學習工程師得以高效地進行模型訓練,并通過簡單的代碼實現(xiàn)新模型構建或現(xiàn)有模型遷移,提高工作效率的同時降低運營成本。
Habana Gaudi2處理器在縮短訓練時間(TTT)方面相較第一代Gaudi有了顯著提升。Habana Labs于2022年5月提交的Gaudi2處理器在視覺和語言模型訓練時間上已超越英偉達A100-80G的MLPerf測試結果。其中,針對視覺模型ResNet-50,Gaudi2處理器的TTT結果相較英偉達A100-80GB縮短了36%,相較戴爾提交的同樣針對ResNet-50和BERT模型、采用8個加速器的A100-40GB服務器,Gaudi2的TTT測試結果則縮短了45%。
MLCommons發(fā)布的數(shù)據(jù),2022年6月。https://mlcommons.org/en/training-normal-20/
相比于第一代Gaudi處理器,Gaudi2在ResNet-50模型的訓練吞吐量提高了3倍,BERT模型的訓練吞吐量提高了4.7倍。這些歸因于制程工藝從16納米提升至7納米、Tensor處理器內(nèi)核數(shù)量增加了三倍、增加GEMM引擎算力、封裝的高帶寬存儲容量提升了三倍、SRAM帶寬提升以及容量增加一倍。對于視覺處理模型的訓練,Gaudi2處理器集成了媒體處理引擎,能夠獨立完成包括AI訓練所需的數(shù)據(jù)增強和壓縮圖像的預處理。
兩代Gaudi處理器的性能都是在沒有特殊軟件操作的情況下通過Habana客戶開箱即用的商業(yè)軟件棧實現(xiàn)的。
通過商用軟件所提供的開箱即用性能,在Habana 8個GPU服務器與HLS-Gaudi2參考服務器上進行測試比對。其中,訓練吞吐量來自于NGC和Habana公共庫的TensorFlow docker,采用雙方推薦的最佳性能參數(shù)在混合精度訓練模式下進行測量。值得注意的是,吞吐量是影響最終訓練時間收斂的關鍵因素。
圖形測試配置詳見說明部分。
圖形測試配置見說明部分。
除了Gaudi2在MLPerf測試中的卓越表現(xiàn),第一代Gaudi在128個加速器和256個加速器的ResNet基準測試中展現(xiàn)了強大的性能和令人印象深刻的近線性擴展,支持客戶高效系統(tǒng)擴展。
Habana Labs首席運營官Eitan Medina表示:“我們最新的MLPerf測試結果證明Gaudi2在訓練性能方面顯著優(yōu)勢。我們將持續(xù)深度學習訓練架構和軟件創(chuàng)新,打造最具性價比的AI訓練解決方案。”
關于MLPerf基準測試:MLPerf社區(qū)旨在設計公平且極具實際價值的基準測試,以公平地測量機器學習解決方案的準確度、速度和效率。該社區(qū)由來自學術界、研究實驗室和業(yè)界的AI領導者創(chuàng)建,他們確立基準并制定了一套嚴格的規(guī)則,以確保所有參與者均能夠公平公正地進行性能比對。基于一套明確的規(guī)則,以及能夠對端到端任務進行公平比較,目前MLPerf是AI行業(yè)唯一可靠的基準測試。此外,MLPerf基準測試結果要經(jīng)過為期一個月的同行評審,這將進一步驗證報告結果。
說明:
ResNet-50性能對比中使用的測試配置
A100-80GB:Habana于2022年4月在Azure實例Standard_ND96amsr_A100_v4上進行測量,使用了一個A100-80GB,其中應用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
A100-40GB:Habana于2022年4月在DGX-A100上進行測量,使用了一個A100-40GB,其中應用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
V100-32GB?:Habana于2022年4月在p3dn.24xlarge上進行測量,使用了一個V100-32GB,其中應用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)
Gaudi2:Habana于2022年5月在Gaudi2-HLS系統(tǒng)上進行測量,使用了一個Gaudi2,其中應用了SynapseAI TF docker 1.5.0(BS=256)
結果可能有所不同。
BERT性能對比中使用的測試配置
A100-80GB:Habana于2022年4月在Azure實例Standard_ND96amsr_A100_v4上進行測試,使用了一個A100-80GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=312,accu steps=256;Phase-2:seq len=512,BS=40,accu steps=768)
A100-40GB:Habana于2022年4月在DGX-A100上進行測試,使用了一個A100-40GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)
V100-32GB:Habana于2022年4月在上p3dn.24xlarge進行測試,使用了一個V100-32GB,包含NGC的TF docker 21.12-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=8,accu steps=4096)
Gaudi2:Habana于2022年5月在上Gaudi2-HLS進行測試,使用了一個Gaudi2,包含SynapseAI TF docker 1.5.0(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)
結果可能有所不同。
Habana Labs、Habana、Habana標識、Gaudi和SynapseAI是Habana Labs的商標。
+++
關于英特爾
英特爾(NASDAQ: INTC)作為行業(yè)引領者,創(chuàng)造改變世界的技術,推動全球進步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進半導體設計與制造,幫助我們的客戶應對最重大的挑戰(zhàn)。通過將智能融入云、網(wǎng)絡、邊緣和各種計算設備,我們釋放數(shù)據(jù)潛能,助力商業(yè)和社會變得更美好。如需了解英特爾創(chuàng)新的更多信息,請訪問英特爾中國新聞中心intel.cn/content/www/cn/zh/newsroom以及官方網(wǎng)站intel.cn。
關鍵詞: 訓練時間 基準測試 測試結果 解決方案 數(shù)據(jù)中心
您可能也感興趣:
今日熱點
為您推薦
青海出臺措施健全重特大疾病醫(yī)療保險制度 提高大病保險保障能力
深港保險合作進一步合作 兩地保險業(yè)發(fā)展將獲得更大空間
山西確定社會保險費月繳費基數(shù) 上限為17742元
更多
- 視點!ExaGrid入選首次發(fā)布的“MES Matters - 服務于中型...
- 環(huán)球今亮點!Medidata宣布快速擴展其傳感器云網(wǎng)絡,再添10家...
- 世界今亮點!Habana Gaudi2性能穩(wěn)超英偉達A100,助力實現(xiàn)高效AI訓練
- 【天天熱聞】Boyd收購Sensata的熱測試和控制業(yè)務
- 每日快報!意法半導體NanoEdge AI Studio更新,支持智能傳感...
- 熱點在線丨貿(mào)澤開售面向AI視覺IoT應用的Renesas RZ/V2L高精度MPU
- 每日快播:LG Innotek成功開發(fā)汽車室內(nèi)用雷達模塊 提高乘客安全性
- 全球快消息!Microchip發(fā)布全新maXTouch?顯示屏旋鈕(KoD?...
排行
最近更新
- 世界今亮點!Habana Gaudi2性能穩(wěn)超英偉達A100,助力實現(xiàn)高效AI訓練
- 每日快報!意法半導體NanoEdge AI Studio更新,支持智能傳感...
- 環(huán)球今亮點!Medidata宣布快速擴展其傳感器云網(wǎng)絡,再添10家...
- 視點!ExaGrid入選首次發(fā)布的“MES Matters - 服務于中型...
- 【天天熱聞】Boyd收購Sensata的熱測試和控制業(yè)務
- 環(huán)球熱文:鼓勵創(chuàng)新 廈門市技術創(chuàng)新基金增加至150億元
- 大連高新區(qū)大力發(fā)展數(shù)字經(jīng)濟 力爭在全市率先實現(xiàn)數(shù)字化轉型
- 遼寧七市一區(qū)開展城市間營銷互動 提升“沈陽都市旅游圈”品牌
- 焦點速讀:磚茶怎么煮用什么水
- 每日熱門:楊梅里很多蟲子還能吃嗎
- 每日看點!支持農(nóng)業(yè)主體 落實農(nóng)業(yè)信貸擔保政策
- 【世界播資訊】施足金融底肥 “夏糧”喜獲豐收
- 【天天速看料】紫砂壺的泥怎樣才是好的
- 天天熱點!楊梅有蟲不能吃嗎
- 快報:三部門印發(fā)通知 吸納就業(yè)社會保險“直補快辦”
- 天天即時看!紫砂壺這幾種泥料別碰
- 世界信息:央企保理成行業(yè)生力軍
- 視訊!2022年全球1000強銀行公布
- 即時焦點:千萬患者的福音!胰島素集采在31省全面落地
- 環(huán)球快看:全球投資者顯示出對家電、食品飲料行業(yè)的明顯偏好
- 天天新資訊:安徽新增確診病例52例、無癥狀感染者179例
- 焦點資訊:蒙娜麗莎:截至6月底公司耗資8747萬元累計回購464萬股
- 焦點快看:鋰電原材料價格“高攀不起” 鈉電池迎來加速發(fā)展期
- 環(huán)球訊息:重度肥胖導致病危 昆醫(yī)大附二院救回小伙一命
- 每日快看:智云健康闖關港交所:以銷售醫(yī)療用品為主,三年虧...
- 焦點速讀:新城控股:截至2022年6月30日公司尚未開始實施回購...
- 【天天聚看點】天數(shù)怎么算?幾天檢一次?哪里需要48小時內(nèi)核...
- 世界熱推薦:多家防盜門知名企業(yè)齊登質量黑榜
- 每日速看!Otherside將于7月6日和9日進行兩次負載測試,用戶需...
- 焦點要聞:截至7月4日24時江蘇新型冠狀病毒肺炎疫情最新情況
今日要聞
- 大連高新區(qū)大力發(fā)展數(shù)字經(jīng)濟 力爭在全市率先實現(xiàn)數(shù)字化轉型
- 遼寧七市一區(qū)開展城市間營銷互動 提升“沈陽都市旅游圈”品牌
- 視點!ExaGrid入選首次發(fā)布的“MES Matters - 服務于中型市場的主要廠商”榜單
- 環(huán)球今亮點!Medidata宣布快速擴展其傳感器云網(wǎng)絡,再添10家衛(wèi)生技術創(chuàng)新組織
- 世界今亮點!Habana Gaudi2性能穩(wěn)超英偉達A100,助力實現(xiàn)高效AI訓練
- 【天天熱聞】Boyd收購Sensata的熱測試和控制業(yè)務
- 前5月海南省固定資產(chǎn)投資增長7.4% 儋洋經(jīng)濟圈投資發(fā)力
- 環(huán)球熱文:鼓勵創(chuàng)新 廈門市技術創(chuàng)新基金增加至150億元
- 世界熱推薦:多家防盜門知名企業(yè)齊登質量黑榜
- 每日快報!意法半導體NanoEdge AI Studio更新,支持智能傳感器上的設備端學習和診斷