《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

2020-11-17
來源:機器之心
關鍵詞: AMD GPU

  AMD 發布 Instinct MI100 加速器,它使用最新 Matrix Core 技術,是面向 HPC 和 AI 的新型加速系統。AMD 表示這是全球最快的 HPC GPU,也是首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

微信圖片_20201117143945.png

  當前,GPU 已經成為深度學習訓練的標配,而針對深度學習中的 Tensor 操作,各大廠商在設計軟硬件時都會做特別優化,其中知名的就是英偉達的 Tensor Core。

  今日,對標英偉達 Tensor core,一直發展迅猛的 AMD 也推出了類似功能單元 Matrix Core。同時,基于 Matrix Core 技術,AMD 發布了新型 AMD Instinct MI100 加速器,據稱是全球最快的 HPC GPU 和首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

  據 AMD 官方介紹,AMD Instinct MI100 GPU 配備了全新 AMD CDNA 架構,使用第二代 AMD EPYC 處理器,是面向 HPC 和 AI 的新型加速系統。

  在性能上,MI100 為 HPC 提供了高達 11.5 TFLOPS 的 FP64 峰值性能,為 AI 和機器學習提供了高達 46.1 TFLOPS 的 FP32 Matrix 峰值性能。

  與 AMD 的上一代加速器相比,MI100 憑借新的 AMD Matrix Core 技術,為 AI 訓練提供了近 7 倍的 FP16 理論峰值浮點性能提升。

2.png

3.png

  AMD Instinct MI100 為 HPC 和 AI 提供優秀的性能(圖源:https://www.amd.com/zh-hans/products/server-accelerators/instinct-mi100)

  MI100 的具體規格參見下表:

4.jpg

  AMD 數據中心 GPU 和加速處理公司副總裁 Brad McCredie 表示:「AMD Instinct MI100 的推出,標志著 AMD 朝著百億億級計算邁出了重要的一步。這款新型加速器專為科學計算中重要的工作負載打造,結合 AMD ROCm 開放軟件平臺后,能夠為科學家和研究人員在 HPC 中的工作提供堅實的基礎。」

  此外,AMD 還推出了 ROCm 4.0。ROCm 開發者軟件平臺旨在為百億億級計算提供基礎,包括編譯器、編程 API 和庫。此次推出的 ROCm 4.0 針對基于 MI100 的系統進行了優化,將編譯器升級為開源版本,并支持 OpenMP 5.0 和 HIP。經過 ROCm 4.0 優化,PyTorch 和 Tensorflow 框架可以基于 MI100 實現更高的性能。

  AMD Instinct MI100 加速器的特性

  以下是 AMD Instinct MI100 加速器的關鍵能力和特性:

微信圖片_20201117143958.png

  AMD Instinct MI100 的關鍵特性一覽表(圖源:https://www.amd.com/system/files/documents/instinct-mi100-brochure.pdf)

  全新的 AMD CDNA 架構:該架構專為 AMD GPU 適應百億億級計算時代而打造,是 MI100 加速器的核心,能夠提供卓越的性能和能效。

  適應 HPC 工作負載的 FP64 和 FP32 頂尖性能:峰值 FP64 和峰值 FP32 的性能分別達到 11.5 TFLOPS 和 23.1 TFLOPS,行業領先。

  全新的 Matrix Core 技術:適合多種單精度和混合精度矩陣運算(如 FP32、FP16、bFloat16、Int8 和 Int4)的超強性能,從而提升 HPC 和 AI 的收斂性能。

  第二代 AMD Infinity Fabric 技術:Instinct MI100 提供大約二倍的 PCIe 4.0 接口 P2P 峰值 I/O 帶寬,每塊 GPU 配置三條 AMD Infinity Fabric 總線,總帶寬高達 340 GB/s。在服務器上,MI100 GPU 可以配置兩個全連接 quad GPU hive,每個提供高達 552 GB/s 的 P2P I/O 帶寬,從而實現快速數據共享。

  超快 HBM2 內存:32GB 高帶寬 HBM2 內存,時鐘速率為 1.2 GHz,可以提供超高的 1.23 TB/s 內存帶寬,以支持大型數據集,并消除數據進出內存的瓶頸。

  支持業內最新的 PCIe Gen 4.0:支持最新的 PCIe Gen 4.0 技術,提供高達 64GB/s 的 CPU 到 GPU 理論數據傳輸帶寬。

  原文鏈接:https://ir.amd.com/news-events/press-releases/detail/981/amd-announces-worlds-fastest-hpc-accelerator-for

  Amazon SageMaker 1000元大禮包

  ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全托管機器學習平臺,支持絕大多數機器學習框架與算法,并且用 IDE 寫代碼、可視化、Debug一氣呵成。

  現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕松。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: a级成人毛片免费视频高清| 国产精品国产三级国产普通话| 亚洲综合色视频在线观看| 黄色免费短视频| 帅哥我要补个胎小说| 亚洲av日韩精品久久久久久久 | 一本大道香一蕉久在线影院| 欧美一级特黄aa大片在线观看免费 | 久久久久久亚洲av无码专区 | 无码日韩精品一区二区三区免费| 亚洲欧美国产中文| 美女视频黄频大全免费| 国产精品美女久久久网av| 中国好声音第二季免费播放| 欧美a欧美1级| 亚洲日本va在线观看| 波多野结衣欲乱上班族| 俄罗斯激情女同互慰在线| 蜜桃成熟时2005| 国产成人一区二区三区精品久久| 99视频有精品视频免费观看| 小兔子救了蛇被蛇两根进去| 丝袜人妻一区二区三区网站| 最近中文字幕国语免费完整 | 亚洲欧美日韩另类在线专区| 精品日本一区二区三区在线观看| 国产激情久久久久影院小草| youjizz大全| 怡红院成人影院| 中国大陆一级毛片| 我和岳乱妇三级高清电影| 亚洲av无码片在线观看| 欧美在线高清视频| 免费一级特黄特色大片在线| 视频在线观看一区| 国产精品免费无遮挡无码永久视频| 91精品久久久久久久99蜜桃 | 成在人线AV无码免费| 么公的又大又深又硬想要| 欧美精欧美乱码一二三四区| 亚洲精品视频久久久|