論文解讀:為了數(shù)據(jù)中心的未來,存算這對CP竟然又離了
古語有云:天下大勢分久必合、合久必分。
同樣,在數(shù)據(jù)中心多年的發(fā)展歷程中,計(jì)算與存儲也經(jīng)歷了多次分分合合。從大型機(jī)的計(jì)算與存儲緊耦合,到小型機(jī)經(jīng)典的IOE存算分離架構(gòu),再到隨云興起的超融合讓存算再次融合,計(jì)算與存儲宛如一對多年的CP,時而親密無間,時而又若即若離。
計(jì)算與存儲之所以會出現(xiàn)多次分與合,是因?yàn)樾枨蟮淖兓苿又軜?gòu)層做出相應(yīng)改變,而計(jì)算與存儲相輔相成、協(xié)同發(fā)展的關(guān)系始終未變。如今,隨著云與互聯(lián)網(wǎng)業(yè)務(wù)場景的大量涌現(xiàn),新型存算分離架構(gòu)開始興起,計(jì)算與存儲再次加速走向分離。
為何存算分離架構(gòu)會成為數(shù)據(jù)中心未來十年最大的趨勢?新型存算分離架構(gòu)與過往有何不同?新型存算分離架構(gòu)的關(guān)鍵技術(shù)和挑戰(zhàn)又有哪些?近日,CCF會士、信息存儲專委會主任、清華大學(xué)教授、廈門大學(xué)信息學(xué)院院長舒繼武教授的一篇論文《新型存算分離架構(gòu)技術(shù)展望》引發(fā)業(yè)界廣泛共鳴,讓我們從中一探究竟。
場景變化推動存算再次分離
舒繼武教授在論文中指出,云、互聯(lián)網(wǎng)、大數(shù)據(jù)、AI等推動新業(yè)務(wù)場景的高速發(fā)展,給基于服務(wù)器部署存儲的融合架構(gòu)帶來極大挑戰(zhàn),主要包括:其一、數(shù)據(jù)保存周期與服務(wù)器更新周期不匹配;其二、性能可靠性與資源利用率難以兼得;其三、無服務(wù)器(Serverless)應(yīng)用等新型分布式應(yīng)用有共享存儲的訴求;其四、數(shù)據(jù)中心稅導(dǎo)致數(shù)據(jù)密集型應(yīng)用效率低下。
如何理解舒繼武教授提出的四大挑戰(zhàn)?我們先從業(yè)務(wù)形態(tài)變化與資源需求響應(yīng)的角度來解讀。
眾所周知,隨著數(shù)字化轉(zhuǎn)型的深入,很多行業(yè)用戶存在著大量云與互聯(lián)網(wǎng)業(yè)務(wù)場景,業(yè)務(wù)形態(tài)逐漸變化,業(yè)務(wù)的動態(tài)性增強(qiáng),使得對基礎(chǔ)設(shè)施資源的靈活性和利用率要求大幅提升。此時,基于服務(wù)器部署存儲的融合架構(gòu)其缺點(diǎn)得到持續(xù)放大。
例如,計(jì)算與存儲更新周期不匹配,使得擴(kuò)展時資源得不到充分利用,還增加了數(shù)據(jù)遷移等工作;支撐業(yè)務(wù)的服務(wù)器存儲無論是性能型還是容量型,均無法同時實(shí)現(xiàn)高性能、高可靠性與高資源利用率等。
另一方面,以無服務(wù)器(serverless)應(yīng)用為代表的新型分布式應(yīng)用的興起,就像一股催化劑,加速了業(yè)務(wù)數(shù)據(jù)共享訪問的需求,使得存算分離架構(gòu)獲得更多用戶關(guān)注。
例如,分布式數(shù)據(jù)庫等應(yīng)用紛紛轉(zhuǎn)向容器化部署與應(yīng)用,存算融合的架構(gòu)在CPU、內(nèi)存、存儲容量/IOPS/帶寬,網(wǎng)絡(luò)IO/帶寬等7個維度均很難滿足新型分布式應(yīng)用的需求。業(yè)界一些云數(shù)據(jù)庫公司甚至開始推動存算進(jìn)一步分離,將計(jì)算節(jié)點(diǎn)處理的緩存層和日志功能下推到共享存儲上,以此實(shí)現(xiàn)更高的性能和資源利用率。
正所謂舊的不去新的不來。在業(yè)務(wù)場景、硬件技術(shù)快速發(fā)展等多重因素驅(qū)動下,新型存算分離架構(gòu)正在迅速興起,成為近年來基礎(chǔ)設(shè)施領(lǐng)域最大的熱點(diǎn)。那么,這個“新人”是否堪擔(dān)大任?
新型存算分離架構(gòu)“新”在哪
舒繼武教授在論文中指出,高性能盤框、NVMe/CXL新協(xié)議、專用數(shù)據(jù)處理器(如:DPU)、RDMA/NoF新型網(wǎng)絡(luò)技術(shù)等硬件的快速發(fā)展,為新型存算分離架構(gòu)奠定了基礎(chǔ)。與傳統(tǒng)存算分離架構(gòu)相比,新型存算分離架構(gòu)具有更多新特征:Diskless的服務(wù)器、多樣化的網(wǎng)絡(luò)協(xié)議、專用化的數(shù)據(jù)處理器和極高存力密度的存儲系統(tǒng)。
那么,新舊架構(gòu)對比,區(qū)別到底在哪里?
首先是架構(gòu)處理邏輯的根本性變化。新型存算分離架構(gòu)的興起,標(biāo)志著以通用CPU為核心的處理邏輯加速向以數(shù)據(jù)為中心的處理邏輯轉(zhuǎn)變。這也意味著,服務(wù)器等計(jì)算設(shè)備將逐步走向Diskless,聚焦計(jì)算任務(wù);而專用數(shù)據(jù)處理器、存儲系統(tǒng)將承擔(dān)更加重要的任務(wù),價值與作用將會更加突出。
例如,當(dāng)下大量DPU產(chǎn)品的涌現(xiàn)就是最好證明,DPU將數(shù)據(jù)存儲、訪問等大量操作卸載到專用數(shù)據(jù)處理器上,釋放服務(wù)器的算力,從整體上提升架構(gòu)的能效比。
而取代服務(wù)器本地盤則是面向Diskless架構(gòu)的存儲系統(tǒng),近年來西部數(shù)據(jù)的OpenFlex、Vast Data Ceres高性能盤框、華為的OceanStor Micro微存儲均是新型存算分離架構(gòu)下的存儲系統(tǒng)代表。
其次,新型存算分離架構(gòu)在架構(gòu)上徹底走向解耦,而不僅僅局限于CPU和外存的解耦,這將徹底打破各類存算硬件資源的邊界,組建彼此獨(dú)立的各種硬件資源池,實(shí)現(xiàn)各類硬件的獨(dú)立擴(kuò)展與靈活應(yīng)用。
這種徹底解耦就像搭建樂高積木一樣,每個組件彼此高度獨(dú)立,又能夠靈活組合,可以針對云、互聯(lián)網(wǎng)、AI等業(yè)務(wù)彈性強(qiáng)、變化多等特點(diǎn),進(jìn)行靈活組合和及時響應(yīng)。
處理分工走向更細(xì)顆粒度,每個組件各司其職,如同專業(yè)人做專業(yè)事情,將每個組件的能力發(fā)揮到極致。
當(dāng)然,解耦之后,各個硬件組件徹底走向獨(dú)立和靈活組合,也意味著組件之間的協(xié)作是新型存算分離架構(gòu)必然需要面對的。對此,舒繼武教授在論文中指出,場景化數(shù)據(jù)縮減、高通量超融合網(wǎng)絡(luò)、網(wǎng)存協(xié)同、盤芯協(xié)同等關(guān)鍵技術(shù)對于新型存算分離架構(gòu)發(fā)展至關(guān)重要。
未來存算分離看什么
如今,像DPU、智能盤框、 CXL/NoF等網(wǎng)絡(luò)均獲得了高速發(fā)展,推動著新型存算分離架構(gòu)加速走向落地。舒繼武教授在論文中認(rèn)為,面向云和互聯(lián)網(wǎng)場景的新型存算分離架構(gòu)順應(yīng)了未來數(shù)據(jù)中心可組合式架構(gòu)(composable infrastructure)趨勢,但也面臨著技術(shù)、生態(tài)等方面的挑戰(zhàn)。
具體來看,舒繼武教授認(rèn)為計(jì)算與存儲之間的數(shù)據(jù)訪問接口及標(biāo)準(zhǔn)主要采用塊存儲語義為主,面對今后異構(gòu)算力的快速發(fā)展,內(nèi)存訪問語義、計(jì)算協(xié)同語義等表現(xiàn)出能力不足,還需要產(chǎn)業(yè)界共同探索與解決。
另外,新型存算分離架構(gòu)雖然提供了比以往更出色的基礎(chǔ)設(shè)施能力,但如何發(fā)揮出潛能還需要看應(yīng)用服務(wù)。就像一輛汽車中,新型存算分離架構(gòu)恰如出色的發(fā)動機(jī)和底盤,應(yīng)用服務(wù)框架則是變速箱,如果變速箱不能做出與時俱進(jìn),則這輛汽車很難發(fā)揮出發(fā)動機(jī)的優(yōu)勢。舒繼武教授指出,設(shè)計(jì)更高效的應(yīng)用服務(wù)框架,與上層應(yīng)用實(shí)現(xiàn)完美協(xié)同,是一個長期過程,需要生態(tài)伙伴們共同努力。
雖然有著技術(shù)與生態(tài)方面的挑戰(zhàn),但新型存算分離架構(gòu)已然勢不可擋。未來十年,隨著中國數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,數(shù)據(jù)要素成為最重要的生產(chǎn)要素,以一體化大數(shù)據(jù)中心、智算中心為代表的新基建將持續(xù)獲得持續(xù)建設(shè),在算力高速增長的大趨勢下,新型存算分離以靈活架構(gòu)、精細(xì)化資源利用率和綠色低碳能耗比等優(yōu)勢,有望在云服務(wù)商、電信運(yùn)營商、金融等多個行業(yè)獲得廣泛應(yīng)用。
原文標(biāo)題 : 論文解讀:為了數(shù)據(jù)中心的未來,存算這對CP竟然又離了

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 清華跑出具身智能獨(dú)角獸:給機(jī)器人安上眼睛和大腦,融資近20億
- 5 特朗普要求英特爾首位華人 CEO 辭職
- 6 踢館大廠和微軟,剖析WPS靈犀的AI實(shí)用主義
- 7 騰訊 Q2 財報亮眼:AI 已成第二增長曲線
- 8 谷歌吹響AI沖鋒號,AI還有哪些機(jī)會
- 9 蘋果把身家押在Siri上:一場輸不起的自我革命
- 10 共探合作新機(jī)遇!江門市新會區(qū)(深圳)“AI + 機(jī)器人” 產(chǎn)業(yè)對接會成功舉辦