《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 2.6萬億晶體管,850000個AI內核,Cerebras新一代晶圓級芯片曝光

2.6萬億晶體管,850000個AI內核,Cerebras新一代晶圓級芯片曝光

2021-04-21
來源:半導體行業觀察
關鍵詞: 晶體管 AI

  在過去的幾年中,大量的處理器進入市場,其唯一目的是加速人工智能和機器學習工作負載。由于可能使用不同類型的機器學習算法,因此這些處理器通常專注于幾個關鍵領域,但有一個局限性限制了它們,那就是您可以將處理器制造多大。

  兩年前,Cerebras揭開了芯片設計領域的一場革命:他推出的處理器與您的頭部一樣大——在12英寸晶圓上使用的面積與矩形設計所允許的面積一樣大。據介紹,這個基于16納米工藝打造的芯片可同時專注于AI和HPC工作負載。

  3(1).png

  今天,該公司正在發布其基于臺積電7nm的第二代產品,其內核數量增加了一倍以上,而所有產品的數量都增加了一倍以上。

  第二代WSE(Wafer Scale Engine)

  來自Cerebras的新處理器是基于臺積電(TSMC)的N7工藝打造的。這使得邏輯可以按比例縮小,并在一定程度上縮小了SRAM,現在新芯片上具有850,000個AI內核。

  從下圖我們可以看到,基本上,有關新芯片的所有內容都超過了2倍:

  與最初的處理器(稱為晶圓級引擎(Wafer Scale Engine,WSE-1))一樣,新的WSE-2在46225 mm 2的面積上集成了成千上萬的AI核。在這個空間里,Cerebras集成了2.6萬億個晶體管,構建了850000個AI內核。相比之下,市場上第二大AI CPU約為826 mm 2,具有0.054萬億個晶體管。Cerebras還引用了1000倍的板載內存,帶有40 GB的SRAM,而Ampere A100則為40 MB。

  核心與帶有FMAC數據路徑的2D Mesh連接。Cerebras通過設計一種可以繞開任何制造缺陷的系統來實現100%的良率。

  最初,Cerebras擁有1.5%的額外核心來容納缺陷,但由于臺積電(TSMC)的工藝如此成熟,因此我們被告知這太多了。Cerebras與WSE的目標是提供一個通過創新專利設計的單一平臺,該平臺允許用于AI計算的更大處理器,但也已擴展到更廣泛的HPC工作負載中。

  4(1).png

  建立在第一代WSE之上

  設計的關鍵是自定義的圖形編譯器,它采用pyTorch或TensorFlow并將每一層映射到芯片的物理部分,從而允許在數據流過時進行異步計算。擁有如此大的處理器意味著數據永遠不必掉隊,也不需要在內存中等待,不浪費功率,并且可以以流水線的方式連續地移至計算的下一個階段。編譯器和處理器的設計還考慮到了稀疏性,無論批處理大小如何都可以實現高利用率,或者可以使參數搜索算法同時運行。

5(1).png

  Cerebras的第一代WSE作為CS-1的完整系統的一部分一起打包出售,該公司有數十個已部署并運行了已部署系統的客戶,其中包括許多研究實驗室,制藥公司,生物技術研究,軍事以及石油和天然氣行業。天然氣工業。勞倫斯·利弗莫爾(Lawrence Livermore)將一臺CS-1與其23 PFLOP“拉森”超級計算機配對。匹茲堡超級計算機中心以500萬美元的價格購買了兩個系統,并將這些系統連接到他們的Neocortex超級計算機上,以實現同步AI和增強的計算能力。

  產品和合作伙伴

  Cerebras現在以15U盒的形式出售完整的CS-1系統,其中包含一個WSE-1和12x100 GbE,十二個4 kW電源(6個冗余,峰值功率約23 kW),并且在某些機構中的部署與HPE的SuperDome Flex配對。新的CS-2系統共享相同的配置,盡管內核數量增加了一倍以上,板載內存也增加了一倍,但功耗仍然相同。與其他平臺相比,這些處理器在15U設計中垂直排列,以便在如此大的處理器上易于訪問以及內置的液體冷卻。還應該注意的是,這些前門是用單塊鋁加工而成的。

6(1).png

  Cerebras設計的獨特性能夠超越通常在制造過程中出現的物理制造限制,即標線限制。處理器的設計限制為芯片的最大尺寸,因為很難通過十字線連接兩個區域。這是Cerebras帶到桌上的秘密的一部分,該公司仍然是唯一一家提供這種規模處理器的公司-Cerebras開發并獲得了用于制造這些大型芯片的相同專利仍在這里發揮作用,第二代WSE將內置于CS-2系統中,其在連通性和視覺方面與CS-1相似。

7(1).png

  相同的編譯器和帶有更新的軟件包使已在第一個系統上試用AI工作負載的任何客戶在部署它們時都可以使用第二個系統。Cerebras一直在進行更高級別的實現,以通過添加三行代碼并使用Cerebras的圖形編譯器,使具有標準化TensorFlow和PyTorch模型的客戶非常快速地同化其現有的GPU代碼。然后,編譯器將整個850,000個內核劃分為每層的各個段,從而允許以流水線方式進行數據流而不會造成停頓。芯片還可以同時用于多個網絡以進行參數搜索。

8(1).png

  Cerebras指出,擁有如此龐大的單芯片解決方案意味著跨100多個AI芯片的分布式訓練方法的障礙現在已經遠遠地移開了,以至于在大多數情況下都不需要這種過多的復雜性–為此,我們看到了CS- 1部署到超級計算機的單個系統。

  但是,Cerebras指出,兩個CS-2系統將在一個標準的42U機架中提供170萬個AI內核,或者三個系統在一個更大的46U機架中提供255萬個(假設一次有足夠的功率!)來替換一打機架的替代計算硬件。

  在Hot Chips 2020,該公司首席硬件架構師Sean Lie表示,Cerebras對客戶的主要好處之一是能夠簡化工作負載,以前需要使用GPU / TPU機架,而是可以以計算相關的方式在單個WSE上運行。

9(1).png

  作為一家公司,Cerebras在多倫多,圣地亞哥,東京和舊金山擁有約300名員工。該公司首席執行官安德魯·費爾德曼(Andrew Feldman)表示,作為一家公司,他們已經實現了盈利,已經部署了CS-1的客戶很多,并且在啟動商業系統時已經有更多的客戶在遠程試用CS-2。

  除了AI之外,由于芯片的靈活性使流體動力學和其他計算仿真成為可能,因此Cerebras在典型的商業高性能計算市場(例如,石油和天然氣和基因組學)中引起了很多客戶。CS-2的部署將于今年晚些時候在第三季度進行,價格已從2-3百萬美元升至“幾百萬”美元。

10(1).png



本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 天堂mv在线看中文字幕| 一区二区三区91| 一二三四视频社区在线| 91在线|亚洲| 蜜桃视频一区二区| 狠狠精品干练久久久无码中文字幕| 7777精品久久久大香线蕉| 麻豆国产精品一二三在线观看| 精品无码成人网站久久久久久| 欧美日韩一区二区视频图片| 无遮挡动漫画在线观看| 在线天堂中文www官网| 国产午夜亚洲精品不卡| 佐佐木明希哔哩哔哩| 人妻丰满熟妇AV无码区免| 久久青青草原亚洲AV无码麻豆| а√最新版在线天堂| 国产成人精品1024在线| 狠狠做深爱婷婷综合一区| 日韩av无码一区二区三区不卡毛片 | 亚洲日韩一区二区三区| 中文字幕亚洲第一| xxxxx在线| 狼色精品人妻在线视频免费| 日本毛茸茸的丰满熟妇| 国产麻豆精品精东影业av网站| 国产 欧洲韩国野花视频| 国产人与禽zoz0性伦多活几年 | 无翼乌漫画全彩| 国产精品成人免费视频电影| 兽皇videos极品另类| 久久精品中文騷妇女内射| 91视频完整版高清| 精品久久久久久亚洲精品| 日本高清com| 国产精品久久久久久久伊一| 免费a级在线观看完整片| 久久97久久97精品免视看秋霞 | 精品久久久久久亚洲精品| 日本a中文字幕| 国产成人精品久久综合|