前言:
今年國際固態半導體電路會議(ISSCC)剛剛落下帷幕。從其中研究成果看到下一步的投入方向,從中可以探究整體半導體行業的未來發展動向。
各國入選論文數量的變化
2022年ISSCC共收到投稿論文651篇,其中200篇獲得錄用。
從ISSCC 2022入選論文數量上來看,遠東地區首次超過北美。
從錄用論文的來源國和地區看,美國以69篇繼續領跑,韓國有41篇,而僅有7篇的日本位居第五。
日本獲得錄用的論文數量僅占3.5%,與上一年小幅下降,前沿領域研究的落后可能波及日本的產業競爭力。
比較而言,我國絕大部分來自學術界;而日本、韓國、北美則會有很多公司,這是我們應該重點加強的。
入選論文兩篇以上的企業/大學/研發機構,我國有六家:其中清華大學一家就貢獻了9篇論文。
三星:移動端NPU覆蓋AI算法多面需求
三星工程師分享了即將推出的3nm GAE MBCFET芯片的制造細節,三星已經為MBCFET注冊了商標。
雖然三星目前尚未披露其所有特性,但三星在ISSCC上討論了如何使用新型晶體管來提高SRAM性能和可擴展性。
近年來,SRAM的可擴展性一直落后于邏輯的可擴展性。同時,現代片上系統將SRAM的負載用于各種高速緩存,因此提高其可伸縮性是一項至關重要的任務。
三星的移動端NPU目前已經使用在其4nm Exynos SoC中。
其NPU可以覆蓋INT4、INT8和FP16幾種精度,這些計算精度基本上能覆蓋移動端人工智能算法所有的需求。
例如INT4針對較為簡單的網絡;FP16針對較為復雜對于精度要求更高的網絡。
該NPU有高性能模式和低功耗模式兩種工作模式,從而滿足移動端不同應用場景之間的切換。
覆蓋了手機芯片在日常應用中的痛點,其優化的方向有非常明確的實際應用場景,已經過實戰的打磨。
SK海力士:基于GDDR接口的DRAM存內計算
SK海力士在DRAM存內計算研究中,使用了將計算單元集成在DRAM存儲芯片中的架構并完成了4Gb AiM芯片;
通過DRAM控制器,該DRAM既可以做存內計算,又可以當作正常的DRAM來使用。
AiM相對傳統的GPU+HBM2在常用機器學習模型中可以實現高達10倍的性能提升。
GDDR6 AiM的工作電壓為1.25V,低于現有產品的1.35V工作電壓。
GDDR6-AiM 與 CPU / GPU 的組合,其有望在某些場景下達成16倍的計算速度,預期可在機器學習、高性能計算、大數據計算 / 存儲中得到廣泛的應用。
本次新推出的這款內存,將采用 TSV 硅通孔工藝制造,單顆最大容量可達 24GB。目前這類產品在服務器 CPU 中有應用,與處理器核心緊密封裝在一起,實現高速率。
臺積電:SRAM+下一代存儲器打造差異化IP
SRAM一向是半導體工藝的一個重要基準,因此臺積電抓住下一代SRAM IP將對于鞏固其代工廠龍頭地位有重要作用。
本次由臺積電作為唯一作者機構在ISSCC上發表的SRAM論文是基于其5nm工藝,其64kb的IP可以實現在不同計算精度(INT4–INT8)下實現非常高的計算密度(55.3-221.2 TOPS/mm2)和能效比(70–254 TOPS/W)。
在下一代存儲器方面,臺積電也在和臺清大、佐治亞理工等高校合作發表了多項新技術,涉及RRAM、STT-MRAM、相變存儲器等多種新存儲器。
帶有存內計算的SRAM和下一代存儲器也就成為了臺積電能提供帶有差異化IP的一個重要機會。
作為全球最大的代工廠,臺積電在人工智能領域的投入在本屆ISSCC上主要體現為帶有存內計算的片上存儲器IP,包括SRAM和下一代存儲器(RRAM,STT-MRAM)等。
AMD:應用3D V-Cache新技術
游戲CPU銳龍7 5800X3D即將上市,AMD在ISSCC 2022國際固態電路會議上詳細解讀了這項令游戲性能大漲15%的新技術。
AMD在L3級別使用了共享環形總線設計,CCD中的每個核心都可以訪問整個L3緩存,從而進一步提升性能。
代號Milan-X的EPYC霄龍處理器也使用了3D V-Cache技術,CCD被減薄處理,而后應用臺積電的SoIC技術將V-Cache“面朝下”放置在CCD上。
此外CCD上還會有一層Support Silicon讓它擁有和IOD相同的高度,這樣CPU的封裝尺寸不會發生變化,相應的散熱設計也無需進行調整。
IBM:量子計算的獨特性決定芯片反向
目前量子計算技術面臨的核心問題還是在實證物理階段的困擾,在理論物理階段已經基本成熟。
但進入實證物理階段的時候,需要的是讓這個難以琢磨以及極為不穩定的量子糾纏能夠成為一種可掌握的穩定性技術。
IBM在ISSCC上發表的研究中指出,量子計算的主要目的并不是取代傳統通用計算機,而是在一些專門的問題中:
如質因數分解,化學相關模擬計算、優化問題等獲得遠高于傳統計算機算法的處理速度,這是由于量子計算的獨特特性所決定的。
IBM研制出超過100個量子比特的計算機,表明這項技術具有可拓展性,從而有足夠的計算能力來解決有趣的問題,這是通往更強大機器的鋪路石。
谷歌:研發Sycamore量子計算芯片
谷歌在其論文中指出,控制和讀出芯片將會是量子計算機跨向下一步(即進一步增加量子位數)的關鍵。
也可以說當量子計算機成為主流時,相關的控制和讀出芯片也可望會成為一個新的芯片品類市場。
谷歌在資源庫中提供了豐富并且重要的內容。其中之一是 OpenFermion,與量子化學的內容相關。
第二個是建立在 Google 經典計算硬件上的量子TensorFlow。其張量處理器(TPU)就是運行在這一系統上,并處理量子模擬和機器學習等問題。
Chiplet集成芯片:一場關于維度的戰爭
經過ISSCC 2021 Chiplet的小冷靜期,終于ISSCC 2022的Chiplet論文迎來了大爆發。
兩大CPU廠今年基于Chiplet的爆款產品:英特爾的Ponte Vecchio和AMD的3D-VCache(Zen3) 都在ISSCC上展示了技術細節。
這兩款芯片都實現了真正意義上的3D芯片,從維度上超越了2.5D的CoWoS 和Fanout封裝技術:采用硅inerposer或者RDL外沿層技術實現多層平面互連。
阿里達摩院也實現了基于Hybrid Bonding的近存計算引擎,可用于推薦系統。
復旦大學提出了面向2.5D封裝的可擴展存算一體架構,通過Chiplet技術,達到流片后的再度靈活配置特性,支持不同尺度的終端學習場景。
結尾:
未來已來,而大廠仍未掉隊。存算已經每一類存儲器的爭奇斗艷的舞臺,基于數字方法和近數字方法開始取代了前兩年大行其道的模擬計算,而傳統存儲器大廠臺積電、三星和海力士仍是主角。隨著量子計算的深入而深知,谷歌、IBM等各大廠商也在不斷進化其自研芯片。