在近日舉行的AWS re:Invent 2020(亞馬遜 re:Invent 2020)大會上,AWS首席執行官Andy Jassy宣布了采用最多8個Habana? Gaudi?加速器的EC2實例。對于機器學習工作負載,這些全新EC2實例的性價比相較目前基于GPU的EC2實例提升高達40%。Gaudi加速器專為訓練深度學習模型而設計,適用于自然語言處理、對象檢測和機器學習訓練、分類、推薦以及個性化等工作負載。據介紹,基于Gaudi?的EC2實例計劃于2021年上半年提供使用。
△圖中顯示為Habana Labs的HL-205 Gaudi夾層卡?;贕audi的EC2實例可提供卓越的成本效益和高性能,且同時原生支持TensorFlow、 PyTorch等通用框架。(圖片來源:Habana Labs)
在主題大會上,AWS首席執行官Andy Jassy強調了各行業對高性能、更實惠的人工智能工作的巨大需求。隨著公司計劃引入以Gaudi為特色的新EC2實例進行深度學習訓練,AWS將進一步降低AI數據集的訓練成本,并降低希望利用AI提供業務分析、改善效率和增強用戶體驗的客戶的運營總成本。
8卡的Gaudi 解決方案可以在TensorFlow上每秒處理12000張圖像訓練ResNet-50模型。每個Gaudi處理器集成了32GB的HBM2內存,并集成了用于服務器內部處理器互聯的RoCE功能。憑借AWS彈性架構適配器(EFA)的技術可以跨服務器擴展,從而允許AWS及其客戶無縫地擴展使用多個基于Gaudi的系統以實現高效和可擴展的分布式訓練。
Habana的SynapseAI軟件套件專為在Habana Gaudi處理器上提供高性能的深度學習訓練,SynapseAI與TensorFlow和Pythorch等流行的深度學習框架集成,對Gaudi進行了優化。開發人員將可以獲取開放的Gaudi軟件、參考模型和文檔。參考模型將在Habana的GitHub知識庫中公開發布,并將包括各種流行的模型,如圖像分類、對象檢測、自然語言處理和推薦系統。SynapseAI軟件套件包括Habana的圖形編譯器和實時Tensor Processor Core (TPC)內核庫、固件和驅動程序,以及用于定制內核開發的TPC SDK和SynapseAI Profiler等開發工具。
英特爾公司旗下Habana Labs首席執行官David Dahan表示:“我們為AWS選擇Habana Gaudi處理器用于其即將推出的EC2訓練實例感到自豪。Habana團隊期待繼續與AWS展開合作,為客戶持續提供確保連續性及先進性的產品路線圖。”
重要性:作為全球領先的云服務提供商,AWS被全球各地的開發者用于訓練其人工智能模型。然而,機器學習模型復雜程度的增加推升了訓練所需的時間和成本,特別是在越來越多的數據可用、且開發者尋求改進其模型的情況下。基于Gaudi的EC2實例旨在通過交付高成本效益及高性能,并同時原生支持TensorFlow和PyTorch等通用框架,來滿足這些需求。借助Habana的SynapseAI軟件套件,開發者將能夠輕松地構建新的訓練模型或將現有訓練模型從GPU移植到Gaudi加速器。
英特爾的人工智能和XPU愿景:英特爾在2019年收購了Habana,并借此推進其人工智能戰略,加強其面向云和數據中心的人工智能加速器產品組合。這包含一系列支持商業、社會及科研領域最具前景的人工智能應用場景的產品和技術。這也體現了公司面向提供全面的跨CPU、GPU、FPGA等的XPU架構并以此幫助客戶和整個生態系統釋放數據潛能的轉型。
英特爾數據平臺事業部首席戰略官Remi El-Ouazzane表示:“我們的產品組合反應了人工智能并非是能用一種解決方案來滿足所有場景的計算挑戰。云服務提供商目前已廣泛采用了內置人工智能性能的英特爾?至強?處理器來應對人工智能推理工作負載。通過Habana,我們現在得以幫助他們降低人工智能模型的大規模訓練成本,在高增長的市場機遇中提供極富競爭力的替代選擇?!?/p>
資料顯示,Habana Labs公司總部位于以色列,是一家為數據中心提供可編程深度學習加速器的廠商。美國當地時間2019年12月16日,英特爾公司宣布以20億美元收購了Habana Labs,旨在將增強英特爾的人工智能產品組合,并加快其在快速增長的人工智能芯片新興市場的發展。