8月26月消息,英特爾近日公布了有關其新一代基于 Intel 18A 工藝節點的代號為Clearwater Forest 服務器CPU,曝光的首款產品為288核的E-Core Xeon(至強)系列。
就像Xeon 6系列被分為P-Core和E-Core兩種口味一樣,比如Granite Rapids和Sierra Forest,我們將看到新一代Xeon家族出現在僅P-Core的“Diamond Rapids”和僅E-Core的“Clear Water Forest”系列中。其中,P-Core系列針對性能進行了優化,可處理更多計算密集型和人工智能工作負載,而E-Core的系列則針對效率和處理高密度/橫向擴展工作負載進行了優化。
英特爾在其 Hot Chips 2025 演示中概述了 Clearwater Forest Xeon CPU 將在該公司最新、最好的 18A 工藝節點上制造,Panther Lake 也在客戶端使用該節點,將于今年晚些時候上市。
代號為Clearwater Forest 的 E-Core Xeon CPU 的一些主要亮點包括:
英特爾最新的工藝節點 18A: 提高性能和能效;
英特爾最新的效率核心架構:針對 18A 工藝調整的 IPC 性能提升;
英特爾 Foveros Direct 3D 封裝: 更短的節能路線,更大的LLC(末級緩存);
增加內存帶寬:12 通道 DDR5-8000。
具體來說,英特爾的 Clearwater Forest 基于18A 節點,利用背面供電與全環繞柵極技術相結合,提供 FET Z 擴展之外的眾多優勢。18A 帶來了更低的柵極電容,從而提高了核心邏輯電源效率,更高的電池密度和超過 90% 的電池利用率,改進的信號路由,有助于減少 RC 延遲并進一步提高效率。最后,提供低損耗功率傳輸,損耗降低 4-5%。
在核心架構方面,英特爾正在利用其針對 Clearwater Forest 的 Darkmont E-Core 設計,這是對 Sierra Forest 使用的 Sierra Glen E-Core 的更新。這些內核提供:
更智能的前端;
更深層次的無序引擎;
更大的標量和矢量執行;
增強型內存子系統。
全新的 Clearwater Forest E-Core 前端具有一個 64kB 指令緩存、三個 3 寬指令解碼器,每個周期有 9 次解碼,可提供 50% 以上的指令帶寬,以及一個更準確的分支預測器,可能使用深層分支歷史記錄和更大的結構大小。
OOE(無序引擎)也進行了升級,具有 8 個寬分配(增加 60%),以及 16 個寬停用(增加 2 倍)以實現執行并行性。入門無序窗口大小增加了 60%,有 416 個單位,而 26 個執行端口比上一代增加了 50%。
執行引擎有 26 個執行端口來處理一系列工作負載,而專用硬件則提高了效率。整數和矢量執行單元增加了 2 倍,而負載地址生成增加了 1.5 倍,存儲地址生成提高了 2 倍。
核心內存子系統增加50%,達到Three Load,而Two Store保持不變。提前發布負載可能有助于減少延遲。深度緩沖最多支持128個未解決的L2未命中(增加2倍)。Clearwater Forest上還有先進的預取器,而Xeon E-Core的特定功能列表包括:
L1 數據緩存 ECC;
數據中毒支持;
可恢復的機器檢查;
本地計算機檢查;
52 個物理地址位;
核心鎖步。
英特爾還利用帶有 Clearwater Forest“E-Core”Xeon CPU 的新模塊化架構。這包括 4 MB 的統一 L2 緩存,每個四核集群有 17 個延遲周期,最多可提供 288 MB 的 L2。L2 緩存還提供更高的帶寬,最高可達 2 倍或 400 GB/s。除此之外,基礎Tile還包括一個更大的 LLC,額定大小高達 576 MB。
根據 SpecIntRate'17 中進行的測量,IPC 增長了 17%。每個內核與 L2 緩存共享 200 GB/s 的帶寬,而 35 GB/s 的結構互連將集群連接在一起。
英特爾在構建 Clearwater Forest 時采用了全 3D集成,共有 12 個 CPU 小芯片,這些小芯片是在 18A 工藝節點上制造的。它們位于三個單獨的基礎Tile上,其中包括 Fabric、LLC、內存控制器和 I/O,并且基于 Intel 3 進程節點。該轉接器包含兩個基于 Intel 7 的 I/O 小芯片,并具有高速 I/O、結構和加速器。通信由英特爾的 EMIB 互連解決方案處理。所以總共:
12 個 E 核 CPU 小芯片(Intel 18A);
3 個基本Tile (Intel 3);
2 個 I/O 小芯片(Intel 7)。
Clearwater Forest還使用了一種單片網狀相干結構,該結構使用更短的路線、更多的金屬資源和高密度互連來提高能效。
最后,英特爾分享了2S Clearwater E-Core Xeon解決方案的一些性能方面。CPU支持雙插槽服務器中高達3 TB容量的12通道DDR5-8000內存,以及高達1300 GB/s的內存帶寬。相比之下,英特爾的Sierra Forest在12個通道上支持高達DDR5-6400的DRAM。該平臺支持2 x 96 PCIe Gen5和64個CXL通道,144個UPI(576 GB/s),使用576核+1152 MB LLC解決方案,您可以達到59 TF/s,即5000 GB/s的原始帶寬。
英特爾的Clearwater Forest Xeon系列預計將在今年年底推出,因此請繼續關注即將推出的P-core版本。