《電子技術應用》
您所在的位置:首頁 > 人工智能 > 解決方案 > 使用PCIe交換網結構在多主機系統中優化資源部署

使用PCIe交換網結構在多主機系統中優化資源部署

2020-10-27
作者:Vincent Haché,Microchip Technology Inc. 固件工程技術顧問
來源:Microchip

越來越多的數據中心和其他高性能計算環境開始使用GPU,因為GPU能夠快速處理深度學習和機器學習應用中生成的大量數據。不過,就像許多可提高應用性能的新型數據中心創新一樣,這項創新也暴露出新的系統瓶頸。在這些應用中,用于提高系統性能的新興架構涉及通過一個PCIe?結構在多個主機之間共享系統資源。

PCIe標準(特別是其基于樹的傳統層級)會限制資源共享的實現方式(和實現程度)。不過,可以實現一種低延時的高速結構方法,這種方法允許在多個主機之間共享大量GPU和NVMe SSD,同時仍支持標準系統驅動程序。

PCIe結構方法采用動態分區和多主機單根I/O虛擬化(SR-IOV)共享。各PCIe結構之間可直接路由點對點傳輸。這樣便可為點對點傳輸提供最佳路由,減少根端口擁塞,并且更有效地平衡CPU資源的負載。

傳統上,GPU傳輸必須訪問CPU的系統存儲器,這會導致端點之間發生存儲器共享爭用。  當GPU使用其共享的存儲器映射資源而不是CPU存儲器時,它可以在本地提取數據,無需先通過CPU傳遞數據。這消除了跳線和鏈路以及由此產生的延時,從而使GPU能夠更高效地處理數據。

PCIe的固有限制

PCIe主層級是一個樹形結構,其中的每個域都有一個根聯合體,從該點可擴展到“葉子”,這些“葉子”通過交換網和橋接器到達端點。鏈路的嚴格層級和方向性給多主機、多交換網系統帶來了成本高昂的設計要求。

 

圖片3.png

圖1——多主機拓撲

以圖1所示的系統為例。要符合PCIe的層級,主機1必須在交換網1中有一個專用的下行端口,該端口連接到交換網2中的專用上行端口。它還需要在交換網2中有一個專用的下行端口,該端口連接到交換網3中的專用上行端口,依此類推。主機2和主機3也有類似的要求,如圖2所示。

 

圖片4.png

圖2——每個主機的層級要求

即使是基于PCIe樹形結構的最基本系統,也需要各交換網之間有三個鏈路專用于每個主機的PCIe拓撲。而且,由于主機之間無法共享這些鏈路,因此系統會很快變得極為低效。

此外,符合PCIe的典型層級只有一個根端口,而且盡管“多根I/O虛擬化和共享”規范中支持多個根,但它會使設計更復雜,并且當前不受主流CPU支持。結果會造成未使用的PCIe設備(即端點)滯留在其分配到的主機中。不難想象,這在采用多個GPU、存儲設備及其控制器以及交換網的大型系統中會變得多么低效。

例如,如果第一個主機(主機1)已經消耗了所有計算資源,而主機2和3未充分利用資源,則顯然希望主機1訪問這些資源。但主機1無法這樣做,因為這些資源在它的層級域之外,因此會發生滯留。非透明橋接(NTB)是這種問題的一個潛在解決方案,但由于每種類型的共享PCIe設備都需要非標準驅動程序和軟件,因此這同樣會使系統變得復雜。更好的方法是使用PCIe結構,這種結構允許標準PCIe拓撲容納多個可訪問每個端點的主機。

實施方法

系統使用一個PCIe結構交換網(本例中為Microchip Switchtec? PAX系列的成員)在兩個獨立但可透明互操作的域中實現:即包含所有端點和結構鏈路的結構域以及每個主機專用的主機域(圖3)。主機通過在嵌入式CPU上運行的PAX交換網固件保留在單獨的虛擬域中,因此,交換網將始終顯示為具有直連端點的標準單層PCIe設備,而與這些端點出現在結構中的位置無關。

   

圖片5.png

圖3——每個結構的獨立域

來自主機域的事務會在結構域中轉換為ID和地址,反之,結構域中通信的非分層路由也是如此。這樣,系統中的所有主機便可共享連接交換網和端點的結構鏈路。交換網固件會攔截來自主機的所有配置平面通信(包括PCIe枚舉過程),并使用數量可配置的下行端口虛擬化一個符合PCIe規范的簡單交換網。

當所有控制平面通信都路由到交換網固件進行處理時,數據平面通信直接路由到端點。其他主機域中未使用的GPU不再滯留,因為它們可以根據每個主機的需求動態分配。結構內支持點對點通信,這使其能夠適應機器學習應用。當以符合PCIe規范的方式向每個主機提供功能時,可以使用標準驅動程序。

操作方法

為了解這種方法的工作原理,我們以圖4中的系統為例,該系統由兩個主機(主機1采用Windows?系統,主機2采用Linux?系統)、四個PAX PCIe結構交換網、四個Nvidia M40 GPGPU和一個支持SR-IOV的Samsung NVMe SSD組成。在本實驗中,主機運行代表實際機器學習工作負載的通信,包括Nvidia的CUDA點對點通信基準測試實用程序和訓練cifar10圖像分類的TensorFlow模型。嵌入式交換網固件處理交換網的低級配置和管理,系統由Microchip的ChipLink調試和診斷實用程序管理。      

圖片6.png

圖4:雙主機PCIe結構引擎

四個GPU最初分配給主機1,PAX結構管理器顯示在結構中發現的所有設備,其中GPU綁定到Windows主機。但是,主機上的結構不再復雜,所有GPU就像直接連接到虛擬交換網一樣。隨后,結構管理器將綁定所有設備,Windows設備管理器將顯示GPU。主機將交換網視為下行端口數量可配置的簡單物理PCIe交換網。

一旦CUDA發現了四個GPU,點對點帶寬測試就會顯示單向傳輸速率為12.8 GBps,雙向傳輸速率為24.9 GBps。這些傳輸直接跨過PCIe結構,而無需通過主機。如果運行用于訓練Cifar10圖像分類算法的TensorFlow模型并使工作負載分布在全部四個GPU上,則可以將兩個GPU釋放回結構池中,將它們與主機解除綁定。這樣可以釋放其余兩個GPU來執行其他工作負載。與Windows主機一樣,Linux主機也將交換網視為簡單的PCIe交換網,無需自定義驅動程序,而CUDA也可以發現GPU,并在Linux主機上運行P2P傳輸。性能類似于使用Windows主機實現的性能,如表1所示。

 

截圖20201027160107.png

表1:GPU點對點傳輸帶寬


下一步是將SR-IOV虛擬功能連接到Windows主機,PAX將此類功能以標準物理NVM設備的形式提供,以便主機可以使用標準NVMe驅動程序。此后,虛擬功能將與Linux主機結合,并且新的NVMe設備將出現在模塊設備列表中。本實驗的結果是,兩個主機現在都可以獨立使用其虛擬功能。

務必注意的是,虛擬PCIe交換網和所有動態分配操作都以完全符合PCIe規范的方式呈現給主機,以便主機能夠使用標準驅動程序。嵌入式交換網固件提供了一個簡單的管理接口,這樣便可通過成本低廉的外部處理器來配置和管理PCIe結構。設備點對點事務默認情況下處于使能狀態,不需要外部結構管理器進行額外配置或管理。

總結

PCIe交換網結構是一種能夠充分利用CPU巨大性能的絕佳方法,但PCIe標準本身存在一些障礙。不過,可以通過使用動態分區和多主機單根I/O虛擬化共享技術來解決這些難題,以便可以將GPU和NVMe資源實時動態分配給多主機系統中的任何主機,從而滿足機器學習工作負載不斷變化的需求。

 


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
在线国产精品播放| 亚洲女性裸体视频| 国产午夜精品全部视频在线播放 | 黄色成人在线| 国产美女精品人人做人人爽| 国产精品每日更新| 国产精品yjizz| 欧美午夜精品电影| 欧美新色视频| 国产精品视频内| 国产精品综合| 国产一区观看| 激情综合色综合久久| 亚洲第一福利视频| 亚洲精美视频| 日韩视频免费在线观看| 一区二区三区 在线观看视频| 一区二区三区黄色| 亚洲夜间福利| 亚洲欧美中文日韩在线| 午夜精品一区二区三区在线| 新狼窝色av性久久久久久| 欧美亚洲午夜视频在线观看| 亚洲第一综合天堂另类专| 亚洲黄色有码视频| 亚洲美女网站| 亚洲一区三区在线观看| 欧美一区二区三区日韩视频| 久久国产综合精品| 蜜桃精品一区二区三区 | 欧美精品国产一区| 国产精品国产a级| 国产色婷婷国产综合在线理论片a| 国产一区二区三区不卡在线观看| 在线观看国产成人av片| 亚洲精品一区二区三| 亚洲午夜激情免费视频| 久久国产欧美日韩精品| 亚洲精品乱码久久久久久蜜桃麻豆| 亚洲最新在线| 欧美有码视频| 欧美va天堂| 国产精品久久二区| 伊人一区二区三区久久精品| 日韩特黄影片| 欧美一区二区三区视频| 亚洲美女尤物影院| 欧美一区二区三区久久精品| 欧美成人性网| 国产精品国产三级国产普通话99| 国产综合婷婷| 夜夜嗨av一区二区三区网页 | 亚洲国产美女久久久久| 中日韩视频在线观看| 欧美在线一二三四区| 女同一区二区| 国产精品亚洲激情| 亚洲成人在线| 亚洲一区二区三区精品动漫| 亚洲高清精品中出| 亚洲一区二区免费看| 久久久久久噜噜噜久久久精品| 欧美金8天国| 国产一区二区三区久久悠悠色av | 亚洲综合清纯丝袜自拍| 久久一二三四| 欧美视频中文一区二区三区在线观看 | 国产日韩欧美精品| 亚洲精品美女在线观看| 亚洲欧美日韩精品久久久| 亚洲国产日本| 欧美在线免费播放| 欧美日韩国产免费观看| 韩国v欧美v日本v亚洲v| 在线视频你懂得一区二区三区| 久久精品国产亚洲一区二区| 亚洲一区视频在线| 欧美成在线观看| 国产一区视频网站| 中文一区二区| 日韩西西人体444www| 久久综合久久综合久久综合| 国产精品捆绑调教| 亚洲精品一区二| 亚洲国产另类精品专区| 欧美一区二区视频在线观看| 欧美日韩国产成人高清视频| 欲香欲色天天天综合和网| 亚洲欧美大片| 亚洲一区二区影院| 欧美日韩精品一区二区在线播放| 一区二区亚洲欧洲国产日韩| 午夜性色一区二区三区免费视频| 一区二区三区你懂的| 农村妇女精品| 精品成人一区| 欧美在线亚洲在线| 亚洲第一二三四五区| 欧美一区二区视频在线观看2020 | 国产精品丝袜久久久久久app| 亚洲欧洲一区二区三区在线观看| 欧美在线观看视频在线| 亚洲欧美综合精品久久成人| 欧美日韩在线精品| 亚洲日韩第九十九页| 亚洲国产一区在线观看| 欧美一区二区黄| 国产精品视频免费在线观看| 中日韩美女免费视频网站在线观看| 亚洲精品男同| 欧美成va人片在线观看| 一区二区在线不卡| 亚洲国产高清一区二区三区| 久久欧美中文字幕| 国产一区二区成人久久免费影院| 欧美一区二区三区啪啪| 久久国产精品72免费观看| 国产农村妇女毛片精品久久莱园子| 一区二区三区高清在线观看| 亚洲午夜成aⅴ人片| 欧美日韩在线视频观看| 99在线热播精品免费| 在线亚洲激情| 欧美日精品一区视频| 99精品国产热久久91蜜凸| 国产精品99久久久久久有的能看| 欧美日韩视频在线一区二区观看视频| 亚洲精品欧洲精品| 一区二区三区产品免费精品久久75 | 欧美日韩国产首页在线观看| 亚洲三级观看| 一区二区三区高清在线| 欧美日韩在线视频一区二区| 一区二区三区久久久| 亚洲欧美精品伊人久久| 国产精品一区二区三区四区五区| 亚洲欧美日韩国产综合在线| 久久av二区| 国语自产偷拍精品视频偷 | 久久精品视频免费| 免费久久精品视频| 亚洲人成在线播放网站岛国| 亚洲天天影视| 国产精品影片在线观看| 亚洲成人在线视频播放 | 国产日本欧美一区二区三区| 欧美在线啊v| 欧美xxx在线观看| 亚洲精品中文字| 午夜精品福利视频| 国内精品亚洲| 亚洲国产一区二区a毛片| 欧美日韩成人| 亚洲综合成人在线| 久久综合一区二区三区| 亚洲靠逼com| 欧美在线电影| 亚洲国产高清视频| 午夜精品福利在线观看| 国内精品久久久久久| 亚洲精品久久久久久久久| 欧美系列一区| 久久精品二区| 欧美日韩在线高清| 亚洲激情亚洲| 校园春色综合网| 国产一区二区三区四区三区四| 亚洲精品一区二区在线| 国产精品久久久久9999高清| 久久精品91久久香蕉加勒比| 欧美区二区三区| 午夜精品久久久久久99热| 欧美大胆成人| 亚洲欧美另类久久久精品2019| 欧美11—12娇小xxxx| 亚洲手机视频| 欧美成人影音| 亚洲伊人色欲综合网| 欧美寡妇偷汉性猛交| 亚洲欧美国产不卡| 欧美国产综合| 欧美一级免费视频| 欧美区视频在线观看| 欧美一区二区三区在线| 欧美日韩一区成人| 亚洲成人在线视频播放 | 在线看片一区| 午夜视频在线观看一区| 亚洲第一精品电影| 欧美在线视频观看| 欧美性片在线观看| 亚洲欧洲在线一区| 国产精品一区久久久| 日韩视频一区二区| 国产午夜精品久久久| 亚洲激情另类| 国产欧美日韩免费| 亚洲一区二区三区精品动漫| 亚洲国产va精品久久久不卡综合| 欧美一区二区日韩一区二区|