從前車馬很慢,書信很遠,數據傳輸的速度更是慢到無奈。
許多人可能都有備份硬盤的經歷,或者你也曾向移動硬盤中拷貝大量的電影或者文件資料。對于傳統機械硬盤來說,受限于物理運行速度,磁盤的轉速與磁頭的讀寫遠不及如今的電子元器件,大多數硬盤的速度也不過就是每秒100多MB。
也就是說,傳輸一個普通的高清電影大概需要5-8分鐘,而對于4K甚至8K電影動輒上百GB的體積來說,傳輸效率更是難以想象的。以8K動畫大作《魯魯修R2》為例,該片第一集文件大小達到了驚人的4.5TB,換算下來的傳輸時間要超過8個小時。
很顯然,這種速度是互聯網快節奏難以承受的,而機械硬盤容量“加量不加速”的問題也讓人看到了閃存的優勢。所以從人類邁入高清時代開始,閃存作為更快的傳輸介質就進入了人們的視野,并通過多年來的不懈努力成為了當下包括手機、平板電腦、服務器、存儲等多種設備中的重要存儲介質。即便是在看中容量的企業級領域,全閃存陣列也是許多企業數字化轉型的必要選擇。
但是與之前機械硬盤面臨的問題類似,閃存也同樣遇到了“加量不加速”的問題,只是目前這種局面還并未達到極限。不過業內許多有識之士和領軍企業都在進行高性能、高壽命的存儲產品研發,2018年英特爾發布的、基于3D XPoint技術的傲騰存儲就為整個行業帶來了全新的希望。
其實從誕生之初,英特爾傲騰存儲就引來了行業的關注,特別是最初強調的“速度是目前NAND閃存的1000倍,耐用性也是目前閃存的1000倍,密度是NAND的10倍”等等描述更是引起了大眾的濃厚興趣。事實上,英特爾之所以有如此的自信,也恰恰是由于傲騰產品所采用的創新性3D XPoint架構,提供了強大的數據處理能力。
如今,傲騰系列產品不僅僅在個人消費領域風生水起,在企業級也憑借著出色的性能成為了“高性能”的代名詞。無論是傲騰存儲還是傲騰可擴展內存,都已經在頭部互聯網、大型制造業集團等多個領域當中實現部署,并且取得了出色的成績。
為什么這些行業頂尖企業都會選擇傲騰存儲呢?除了性能之外,還在于傲騰存儲能夠為用戶優化“ACT三大場景”,并針對場景提供差異化的服務能力。所謂的ACT在這里代表了A(Accelerating,加速)、C(Caching,緩存)、T(Tiering,促進應用分層)三個層面,而傲騰技術就是在這三個層面實現了激活。
加速加速再加速,傲騰存儲的立足之本
首先說說A場景——加速。正如我們前面談到的,傲騰存儲的興起就是替代了原有NAND存儲的加速功能,提供了“1000倍”的理論性能提升。甚至我們可以說,傲騰是目前存儲領域讀寫最快的產品,而這種特性也讓它能夠被應用于包括Redis、Oracle Database或者MySQL在內的多種數據庫中,加速數據庫的讀寫操作。
英特爾公司非易失存儲解決方案事業部應用工程部的翁昀先生分享了一則來自于客戶的真實案例。DC P4610是英特爾面向數據中心市場推出的固態盤,也是采用TLC芯片的產品,但是在日常使用中,客戶覺得P4610雖然性能表現不錯,但是與期望的性能仍有差距,所以在P4610的基礎上,客戶將存儲升級到了DC P4800X,后者則是基于傲騰技術打造的“性能怪獸”。
這種升級帶來的提升是立竿見影的,翁昀也對兩者的性能進行了簡單的對比——就IOPS吞吐量表現來說,在70%讀取30%寫入的情況下,傲騰P4800X的性能是P4610的3倍,在壽命上是P4610的5倍,在延遲上只有P4610的五分之一。更夸張的是在QoS動態分配中,傲騰P4800X的表現是P4610的12倍,也讓人驚呼于傲騰的性能優勢。
另一個加速的案例則來自于Ceph環境中,這也是當下云平臺中經常出現的場景。與我們剛才提到的案例類似,在同樣IOPS的要求和讀寫設定之下( 70%讀30%寫),傲騰相對于傳統NAND存儲依然具備強大的優勢。這種優勢體現在單位體積、延遲和整體擁有成本三個方面——
就占用空間和面積來說,傳統的全閃存陣列要達到15萬IOPS吞吐量需要大約19個節點才能實現,但是在使用了傲騰方案之后只要7個節點就能達到相同的效果,由此節省的機房空間和租賃成本是一筆不小的數目;
在延遲方面,雖然全閃存陣列的延遲已經非常可觀,但是同樣的性能下SATA全閃存延遲的讀取延遲需要達到讀4.3毫秒 ,寫入延遲達到8.1亳秒;而相同條件下,采用傲騰加速以后的讀取延遲只有1.2毫秒,寫入延遲也不過2.3亳秒 ,大概只有之前的四分之一;
此消彼長帶來的就是總體擁有成本的降低。以三年周期的使用成本計算,傳統全閃存陣列大概要花掉近60萬美元,但是傲騰平臺只要23萬美元,降低了一大半。如果考慮到傲騰平臺所帶來的性能優勢,從性價比的角度來說優勢可以翻番。
其實這也只是傲騰P4800X的小試牛刀。拷貝過數據的朋友們知道,我們在數據讀寫的時候不怕大塊的視頻數據,而是最擔心于細小的文件,因為這些零碎文件會大大增加盤體的讀寫壓力,也讓傳輸速度大幅度下降。但是傲騰P4800X卻并沒有出現這樣的情況,對于任何容量的數據塊,傲騰P4800X都能保持超高的速寫速度,同時盡可能低的延遲也讓它具備更快的響應速度。
緩存優化,提升的不僅僅是性能
看完了A部分加速的內容,我們再來看看C部分——緩存。要知道,傲騰系列產品的能力是非常全面的,其中的傲騰可持久內存就是以緩存能力為代表,這也進一步證明了傲騰存儲在緩存上的性能,甚至相對于加速的數據庫來說,緩存的讀寫要求更高。
在許多人的印象中,緩存能力都考察的是讀取能力,即如何實現數據的對外輸出。但事實上,由于Cache中的數據需要經常刷新,因此在數據緩存的過程中往往是邊寫邊讀,這也進一步考驗了存儲的性能和穩定性。為此,英特爾上海實驗室也在vSAN環境下進行了P4610和P4800X的再度對比,成績非常喜人。
測試基于虛擬機中的VDBench軟件進行。從最終結果我們可以看到,無論是順序寫、 順序讀還是在隨機讀寫上,傲騰P4800X相對于P4610都有不小的提升,其中順序寫性能提升了50%,、隨機寫4K性能提升接近60%,而所有的混合讀寫操作性能提升都超過了100%。除此之外,在延遲層面的隨機讀寫時間也有一半以上的下降,傲騰P4800X的優勢非常明顯。
“從P4610到P4800X,雖然看似單位容量價格出現了提升,但因為傲騰P4800X需要的容量更小,所以采購壓力變化并不大。不僅如此,P4800X還能夠帶來更好的壽命保障,這對于用戶來說恐怕是除了單純性能指標之外也要關注的內容”,E企研究院首席研究員張廣彬老師如是說。
數據分層,讓冷熱數據智能存放
ACT的最后一個層面是T,即數據分層。其實從大數據時代開始,我們就將數據定義為冷數據、溫數據和熱數據三個層級,而除了最底層、最不常用的冷數據之外,溫數據和熱數據的傳輸都是我們需要關注的問題。那么,如何實現數據分層的自由轉換?是否有一種智能化的方案實現了數據控制呢?
傲騰存儲給出了答案。作為大數據框架之一,Hadoop自誕生之日起到現在一直在發揮作用,不少大數據分析平臺都是基于Hadoop框架所搭建。據翁昀介紹,在某英特爾客戶案例中,原本采用的就是傳統SATA SSD+RAID控制器的方式來實現數據分層。
但是英特爾給出了不同的解決方案——一方面,英特爾為客戶提供了存儲熱數據的傲騰SSD,另一方面又將YARN Temp文件單獨提取出來,通過RAID控制器將冷數據依然保存在原有的SATA SSD上。
這樣首先降低了數據讀寫延遲,而更重要的是解決了原有SATA SSD上0.7 DWPD的限制問題,使得整個Hadoop集群的性能獲得大幅度提升 。如今,該解決方案已經在國內某頭部互聯網企業中實現部署,僅僅通過簡單的分層方式,借助于傲騰存儲就實現了智能化的數據存放管理。
我們常說數據是數字化時代的“石油”,而如何把握這一重要的資源目前在整個業界還沒有最終的結論,許多存儲企業都在各顯其能的提供差異化的解決方案。對于英特爾來說,它所提供的傲騰存儲產品能夠幫助企業實現從加速、緩存優化到數據分層的全方位覆蓋,通過ACT三大層面的特性表現,讓數據實現快速、安全、智能化的數據管理,也幫助客戶更好的邁入數字化時代。
英特爾傲騰存儲,讓你成為數據賽道上的“博爾特”。