《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > AMD發布CDNA 4架構

AMD發布CDNA 4架構

HBM3E加持,聚焦提升AI負載能力
2025-06-19
來源:IT之家
關鍵詞: AMD CDNA4架構 HBM

6 月 19 日消息,科技媒體 chipsandcheese 昨日(6 月 18 日)發布博文,報道稱 AMD 正式發布 CDNA 4 架構,在保持在通用向量運算領域的優勢外,主要聚焦提升低精度數據類型的矩陣乘法性能,以強化人工智能(AI)工作負載處理能力。

1.png

CDNA 4 延續了 CDNA 3 的模塊化設計,采用類似 CPU 的芯粒(chiplet)布局。每個計算芯片單元(XCD)搭載 CDNA 計算單元(CU),通過四塊基底芯片整合八塊 XCD,形成包含 256MB 內存側緩存的完整 GPU 架構。

2.png

與 CDNA 3 的 MI300X 相比,CDNA 4 的 MI355X 通過減少單 XCD 的 CU 數量并關閉部分單元以提升良率,但憑借更高時鐘頻率縮小了性能差距。

3.png

在低精度矩陣運算這個 AI 關鍵指標中,CDNA 4 的每 CU 矩陣吞吐量翻倍,其 FP6 精度性能與英偉達 B200 的流式多處理器(SM)持平。

4.png

但在 8 位與 16 位數據類型中,英偉達仍保持單周期吞吐量優勢。然而,AMD 憑借更高的 CU 數量與頻率,維持了通用向量運算(如 FP32)的絕對領先,單 CU 仍提供 128 條 FP32 運算管線,整體性能遠超英偉達 Blackwell 架構。

5.png

CDNA 4 的核心改進之一是提升本地數據共享(LDS)的容量與帶寬。LDS 容量從 64KB 增至 160KB,讀取帶寬翻倍至每周期 256 字節,并新增“轉置讀取”指令,優化矩陣乘法的內存訪問效率。

6.png

盡管英偉達的共享內存(Shared Memory)在單核容量與緩存靈活性上更優(最高 228KB 可分配為共享內存或 L1 緩存),但 AMD 通過 40MB 全 GPU LDS 容量(B200 僅約 33MB)彌補了核心級存儲的不足。

7.png

顯存方面,MI355X 升級至 HBM3E 技術,總帶寬達 8TB/s,容量 288GB,顯著超越英偉達 B200 的 7.7TB/s 與 180GB。這一優勢在大數據量運算中尤為重要,尤其當 AI 模型超出顯存容量時,AMD 的架構可減少數據交換延遲。

8.png

該媒體認為 AMD 的 CDNA 4 延續了 CDNA 3 的“保守進化”路線,類似 Zen 3 到 Zen 4 的迭代邏輯,通過優化而非顛覆性創新鞏固優勢。其策略聚焦于擴大計算規模與顯存帶寬,同時針對性補足 AI 短板。

9.png

該媒體認為在提升性能方面,AMD 和英偉達的路徑差異顯著:AMD 依賴“大芯片 + 大緩存”模式,而英偉達更注重顯存帶寬與單核效率。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 无码人妻精品一区二区三区久久久| 激情六月在线视频观看| 国产日韩欧美久久久| 99久久国产免费福利| 忍住北条麻妃10分钟让你中出| 久久亚洲精品无码观看不卡 | 中国一级特黄毛片| 日本老熟老太hd| 亚洲gv天堂gv无码男同| 欧美日韩国产网站| 亚洲网站视频在线观看| 粗大的内捧猛烈进出视频| 噜噜噜狠狠夜夜躁| 超碰97人人做人人爱少妇| 国产激情无码一区二区三区| 91亚洲欧美综合高清在线| 夜夜偷天天爽夜夜爱| 一个人看的免费高清视频日本| 我要看真正的一级毛片| 久久久精品中文字幕麻豆发布| 日韩欧美在线观看视频| 亚洲sss视频| 欧美国产成人精品二区芒果视频| 亚洲精品国产啊女成拍色拍| 真实国产乱子伦高清| 午夜一级黄色片| 老司机无码精品A| 国产不卡视频在线观看| 青青青国产精品一区二区| 国产成人福利在线| 欧美人xxxx| 国产精品一区亚洲一区天堂 | 无人码一区二区三区视频| 久久久久女教师免费一区| 日韩精品一区二区三区中文版| 亚洲一区二区无码偷拍| 欧美变态另类刺激| 亚洲国产精品综合久久20| 欧美精品www| 亚洲欧美国产精品第1页| 污污的文章让人起反应的|