近年來,我國從芯片、整機、操作系統、云平臺、中間件到應用軟件等技術領域的創新鏈、產業鏈已初步形成,以X86、ARM、Power等不同架構處理器的為基礎的產業生態框架已基本就緒。國內IT產業生態也隨著新一代技術應用場景不斷拓展,已經形成了多技術路線全棧式支撐能力。在數據中心建設方面,隨著企業"上云用數賦智"的不斷加速和深化,新場景下的算力孤島問題逐漸凸顯。如何實現多種芯片技術路線的高效協同,以應用為導向、從系統設計視角出發,滿足多芯共存、多云異構條件下的云原生環境構建,保障業務應用的穩定運行、平滑切換和線性增長,成為新一代云數據中心架構體系需要攻克的新的挑戰。
云計算是協同紐帶,"一云多芯"是關鍵
‘"一云多芯"是打破小生態、構建大生態的關鍵紐帶。信息技術產業鏈發展迅速,相關技術及產品已開始大規模應用于金融、通信、政府等關鍵行業。但從產業鏈協同上看,各環節垂直封閉、生態離散,多個小生態并行存在。自有封閉小生態的排他性不利于產業的健康發展,難以形成產業合力,同時又給行業用戶在技術選型上帶來困擾。如何打破小生態壁壘,避免因技術選型失誤帶來的業務轉型失敗是各個行業關心的話題。在我們看來,"一云多芯"無疑是個最佳選擇。同時,其在一定程度上激發了IT產業鏈上下游的創新活力,進而促進整體生態的協同發展。
"一云多芯"可滿足用戶算力多樣化需求,并且可有效規避算力孤島。隨著各行各業業務創新的爆發式增長,不同業務場景對算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉移。為充分發揮多元異構(不同架構、不同種類)芯片的能力優勢,金融、能源等關鍵行業應基于多種芯片架構來構建云基礎設施底座,實現多元算力的統一池化管理、統一調度以及業務的差異化部署等,逐步實現從算力并存到算力統一。
"一云多芯"可有效降低供應鏈風險。"一云多芯"是IT產業鏈承上啟下的關鍵環節,具備對下納管底層各種芯片,屏蔽底層基礎設施異構芯片差異,對上提供開放、統一的算力接口。但是,目前在云計算產業中,各服務器芯片的表現參差不一,導致用戶體驗難以一致,應用效果也大相徑庭。用好"一云多芯",可以最大程度的降低技術路線的選擇風險,極大提升業務穩定性以及業務改造的靈活性。
由此可見,無論是從業務角度、技術角度,還是產業鏈角度,踐行"一云多芯"已經成為當下及未來云計算產業發展的關鍵,是產業鏈相關廠商的必然選擇。
"一云多芯"勢在必行,但落地挑戰猶存
"一云多芯"在云計算步新中已經成為業內共識。雖然"一云多芯"目標明確,但在產業落地過程中仍存在多方面挑戰。
首先是理念的轉變。IT基礎架構經過長期的發展,從大機、小機時代逐步演進到云計算時代,開放計算深入人心。但直至今日,芯片指令集、操作系統架構上的差異化依然制約著架構的橫向協同,比如一個應用需要同時適配多個指令集和操作系統的問題仍然很嚴重。IT產業需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉變為以系統為核心的設計,以"以應用為導向,以系統為核心"構建新一代產業生態。"一云多芯"是就是這種理念的具體體現。
其次是缺乏統一的"一云多芯"建設標準、規范。算力標準化是產業的愿景,因此基于"一云多芯"打造的算力平臺需要標準化、統一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同芯片架構資源池的這種模式也包裝成"一云多芯",由于無法實現真正的互聯互通,對業務的連續性造成很大的風險。
實現一云多芯,場景驅動的軟件定義是正道
一云多芯的最終目標是支撐用戶業務在不同架構處理器之間的低成本切換或者自由切換。因此,基于以系統設計為核心的思維,采用以場景驅動的"硬件重構+軟件定義"的融合架構,是數據中心體系結構的發展方向。我們認為可以分"有-好-優"三步走來實現一云多芯的中長期目標。
第一階段,混合部署、統一管理、統一視圖
第一階段解決"有"的問題。以云為入口,通過云操作系統實現異構處理器服務器的統一管理,覆蓋國內外主流處理器,提供統一操作界面、操作方式及統一監控運維等,解決云資源池只能承載單一廠商或單一架構處理器的服務器而導致的應用無法跨架構部署、協同的問題。
第二階段,業務牽引、分層解耦、架構升級
第二階段解決"好"的問題。在第一階段的基礎上,進一步實現應用的低成本跨架構切換。通過資源層、平臺層和應用層的"分層解耦"設計,實現架構升級。
在資源層面,通過跨平臺的遷移實現應用跨架構快速部署。
在平臺層面,實現平臺應用的跨架構混合部署,如數據庫集群在一云多芯平臺上實現跨架構的狀態同步、數據同步,實現了多實例在不同處理器架構的服務器上的并行運行。
在應用層面,可通過服務網格等技術實現應用的跨架構流量切分。
第三階段,算力標準、全棧多芯、生態共建
這個階段是解決"優"的問題。從業務連續性的維度,我們認為"一云多芯"的終極目標是實現應用與芯片架構的徹底解耦。這需要硬件、云以及應用等產業鏈上下游的共同協同,完善異構架構下有效算力的量化方法,以支持應用在不同架構處理器間的等價切換。共同推動應用與云基礎設施的一云多芯相結合,打造垂直一體化方案,實現應用層面的跨架構無感知切換。在標準和測評方面,聯合專業軟件測評機構及產業鏈上下游生態,形成一云多芯行業標準。
寫在最后:
"一云多芯"已經不再是一個簡單的口號,而是構建我國IT產業新生態的關鍵路徑。浪潮信息參編的基礎設施云管理軟件、虛擬化云平臺和容器平臺等多個國家級、行業級標準,也是以分層解耦、生態共建的理念推進我國信息產業健康有序發展。同樣,中國人民銀行印發的金融科技發展規劃中,也對金融行業"一云多芯"的發展以及相關金融云平臺應用標準提出了明確的目標及要求。浪潮信息配合某國有大型銀行進行了"一云多芯"的實踐,采用多種芯片服務器和云海OS,完成了核心MPP數倉產品的認證測試并實現大規模生產系統應用。同時,針對大數據、消息中心、緩存系統等核心業務平臺也全面開展了合作。浪潮信息參與建設的多個行業云平臺,在支持一云多芯的基礎上,遠程跨域管理、集群規模及線性擴展能力同樣達到業界領先水平,單資源池規模超過1000節點并可按控制器實現線性擴展,支撐了金融、能源、交通等行業云數智多樣化業務需求。
由此可見,遵從"以應用為導向、以系統為核心"的設計理念,秉承"分層解耦、開放標準"的"一云多芯"建設原則,在云計算步新的發展中顯得愈發重要,這必將加速IT產業生態的繁榮。
浪潮信息副總裁張東
云計算是協同紐帶,"一云多芯"是關鍵
‘"一云多芯"是打破小生態、構建大生態的關鍵紐帶。信息技術產業鏈發展迅速,相關技術及產品已開始大規模應用于金融、通信、政府等關鍵行業。但從產業鏈協同上看,各環節垂直封閉、生態離散,多個小生態并行存在。自有封閉小生態的排他性不利于產業的健康發展,難以形成產業合力,同時又給行業用戶在技術選型上帶來困擾。如何打破小生態壁壘,避免因技術選型失誤帶來的業務轉型失敗是各個行業關心的話題。在我們看來,"一云多芯"無疑是個最佳選擇。同時,其在一定程度上激發了IT產業鏈上下游的創新活力,進而促進整體生態的協同發展。
"一云多芯"可滿足用戶算力多樣化需求,并且可有效規避算力孤島。隨著各行各業業務創新的爆發式增長,不同業務場景對算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉移。為充分發揮多元異構(不同架構、不同種類)芯片的能力優勢,金融、能源等關鍵行業應基于多種芯片架構來構建云基礎設施底座,實現多元算力的統一池化管理、統一調度以及業務的差異化部署等,逐步實現從算力并存到算力統一。
"一云多芯"可有效降低供應鏈風險。"一云多芯"是IT產業鏈承上啟下的關鍵環節,具備對下納管底層各種芯片,屏蔽底層基礎設施異構芯片差異,對上提供開放、統一的算力接口。但是,目前在云計算產業中,各服務器芯片的表現參差不一,導致用戶體驗難以一致,應用效果也大相徑庭。用好"一云多芯",可以最大程度的降低技術路線的選擇風險,極大提升業務穩定性以及業務改造的靈活性。
由此可見,無論是從業務角度、技術角度,還是產業鏈角度,踐行"一云多芯"已經成為當下及未來云計算產業發展的關鍵,是產業鏈相關廠商的必然選擇。
"一云多芯"勢在必行,但落地挑戰猶存
"一云多芯"在云計算步新中已經成為業內共識。雖然"一云多芯"目標明確,但在產業落地過程中仍存在多方面挑戰。
首先是理念的轉變。IT基礎架構經過長期的發展,從大機、小機時代逐步演進到云計算時代,開放計算深入人心。但直至今日,芯片指令集、操作系統架構上的差異化依然制約著架構的橫向協同,比如一個應用需要同時適配多個指令集和操作系統的問題仍然很嚴重。IT產業需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉變為以系統為核心的設計,以"以應用為導向,以系統為核心"構建新一代產業生態。"一云多芯"是就是這種理念的具體體現。
其次是缺乏統一的"一云多芯"建設標準、規范。算力標準化是產業的愿景,因此基于"一云多芯"打造的算力平臺需要標準化、統一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同芯片架構資源池的這種模式也包裝成"一云多芯",由于無法實現真正的互聯互通,對業務的連續性造成很大的風險。
實現一云多芯,場景驅動的軟件定義是正道
一云多芯的最終目標是支撐用戶業務在不同架構處理器之間的低成本切換或者自由切換。因此,基于以系統設計為核心的思維,采用以場景驅動的"硬件重構+軟件定義"的融合架構,是數據中心體系結構的發展方向。我們認為可以分"有-好-優"三步走來實現一云多芯的中長期目標。
"一云多芯"三步走技術路線
第一階段,混合部署、統一管理、統一視圖
第一階段解決"有"的問題。以云為入口,通過云操作系統實現異構處理器服務器的統一管理,覆蓋國內外主流處理器,提供統一操作界面、操作方式及統一監控運維等,解決云資源池只能承載單一廠商或單一架構處理器的服務器而導致的應用無法跨架構部署、協同的問題。
第二階段,業務牽引、分層解耦、架構升級
第二階段解決"好"的問題。在第一階段的基礎上,進一步實現應用的低成本跨架構切換。通過資源層、平臺層和應用層的"分層解耦"設計,實現架構升級。
在資源層面,通過跨平臺的遷移實現應用跨架構快速部署。
在平臺層面,實現平臺應用的跨架構混合部署,如數據庫集群在一云多芯平臺上實現跨架構的狀態同步、數據同步,實現了多實例在不同處理器架構的服務器上的并行運行。
在應用層面,可通過服務網格等技術實現應用的跨架構流量切分。
第三階段,算力標準、全棧多芯、生態共建
這個階段是解決"優"的問題。從業務連續性的維度,我們認為"一云多芯"的終極目標是實現應用與芯片架構的徹底解耦。這需要硬件、云以及應用等產業鏈上下游的共同協同,完善異構架構下有效算力的量化方法,以支持應用在不同架構處理器間的等價切換。共同推動應用與云基礎設施的一云多芯相結合,打造垂直一體化方案,實現應用層面的跨架構無感知切換。在標準和測評方面,聯合專業軟件測評機構及產業鏈上下游生態,形成一云多芯行業標準。
寫在最后:
"一云多芯"已經不再是一個簡單的口號,而是構建我國IT產業新生態的關鍵路徑。浪潮信息參編的基礎設施云管理軟件、虛擬化云平臺和容器平臺等多個國家級、行業級標準,也是以分層解耦、生態共建的理念推進我國信息產業健康有序發展。同樣,中國人民銀行印發的金融科技發展規劃中,也對金融行業"一云多芯"的發展以及相關金融云平臺應用標準提出了明確的目標及要求。浪潮信息配合某國有大型銀行進行了"一云多芯"的實踐,采用多種芯片服務器和云海OS,完成了核心MPP數倉產品的認證測試并實現大規模生產系統應用。同時,針對大數據、消息中心、緩存系統等核心業務平臺也全面開展了合作。浪潮信息參與建設的多個行業云平臺,在支持一云多芯的基礎上,遠程跨域管理、集群規模及線性擴展能力同樣達到業界領先水平,單資源池規模超過1000節點并可按控制器實現線性擴展,支撐了金融、能源、交通等行業云數智多樣化業務需求。
由此可見,遵從"以應用為導向、以系統為核心"的設計理念,秉承"分層解耦、開放標準"的"一云多芯"建設原則,在云計算步新的發展中顯得愈發重要,這必將加速IT產業生態的繁榮。