7月11日消息,據The Information最新發布的一份報告稱,中國科技巨頭華為正在尋求改變其人工智能芯片設計策略,從 ASIC (專用集成電路)轉向GPGPU(通用圖形處理器)芯片,以便從英偉達(NVIDIA)手中奪取更多的市場份額。
盡管美國對中國實施半導體出口制裁,阻止英偉達在中國大陸銷售其先進的 AI 芯片,但英偉達的產品仍然是中國大陸需求最廣泛的AI芯片。而這主要是得益于英偉達GPGPU架構及強大的CUDA生態。
眾所周知,GPU本身是設計來支持圖形計算的,但其強大的并行計算能力使得它能夠處理各種計算任務。隨后,英偉達就針對AI應用推出了有很強的編程靈活性和適應性的GPGPU,結合自己的CUDA軟件編程框架,可以處理不同類型的負載,比如圖形渲染、科學計算、深度學習等。
而華為的昇騰AI芯片則是為AI計算優化的ASIC,它主要針對深度學習推理和訓練進行特化。這種定制化使得它在特定任務上有更高的性能和能效,但對于圖形渲染、并行計算、科學計算等通用計算任務上的效率和靈活性就不如GPGPU。
比如,目前許多AI應用(尤其是深度學習)主要使用單精度(FP32)和低精度(如INT8或FP16)浮點運算,因為這些操作能夠提供足夠的精度,并且能在較低的計算資源下完成。昇騰AI芯片這種AISC架構可以優化這類AI計算的效率,但是卻無法支持雙精度浮點(FP64)計算。相比之下,英偉達的H100/H20這類加速器,不僅支持單精度和半精度浮點計算,還能有效支持雙精度浮點計算,這也讓它們可以用于更廣泛的科學計算、工程模擬等任務。
此外,在軟件生態上,英偉達CUDA平臺擁有成熟的開發生態和大量優化好的庫(如cuDNN、TensorRT),可以為廣泛的應用場景提供支持。開發者可以利用這些工具和庫大大簡化開發工作。
而華為昇騰AI芯片則采用的是自研的CANN(神經網絡計算架構)軟件平臺來實現算力調度與執行。雖然華為也推出了MindSpore等深度學習框架,但它的生態系統和開發者支持,相比英偉達的CUDA生態還是要差很多。
總的來說,昇騰AI芯片作為ASIC的優勢在于AI計算的高效能和低功耗,但在計算任務的靈活性、雙精度浮點支持以及開發生態方面,與英偉達以及部分國產GPGPU廠商仍有一定的差距。目前其他的國產GPGPU廠商在發展自有生態的同時都有兼容CUDA生態。
The Information的報告指出,華為想要提升其AI芯片在中國大陸市場的份額正面臨的一個主要瓶頸,即華為AI芯片采用的是CANN(神經網絡計算架構)軟件平臺來實現算力調度與執行。但是,CANN并未得到行業的廣泛的支持,遠不及英偉達的CUDA。
據悉,華為的新的AI芯片在轉向GPGPU后將配備新的軟件,允許用戶通過中間件以兼容英偉達的 CUDA 編程語言,該軟件也可以將CUDA的指令轉換為適用于華為AI芯片的語言。消息人士補充說,華為也有興趣采用英偉達和AMD使用的芯片功能模型。
報告稱,雖然目前華為的AI芯片是ASIC,但該公司有興趣擴展其通用計算產品。這一轉變將使得華為的AI芯片能夠被更廣泛地使用,并可能有助于華為增加其在中國AI芯片市場的份額。