戴爾高性能計(jì)算系統(tǒng)——Discover
為了滿足氣候研究中存在的數(shù)據(jù)存儲(chǔ)和計(jì)算需求,NASA專門設(shè)立了氣候模擬中心(NCCS)。濟(jì)南戴爾服務(wù)器代理商指出,其內(nèi)部運(yùn)營著強(qiáng)大的計(jì)算資源庫,這些資源包括一個(gè)龐大且不斷發(fā)展的高性能計(jì)算系統(tǒng)——Discover,它擁有大約90個(gè)機(jī)架和90000個(gè)內(nèi)核。
考慮到Discover被設(shè)計(jì)用來支持大規(guī)模的模擬,無法對高性能計(jì)算與大數(shù)據(jù)相結(jié)合的應(yīng)用進(jìn)行優(yōu)化,NCCS又推出了高級數(shù)據(jù)分析平臺(Advanced Data Analytics PlaTform,ADAPT)。
該平臺是一個(gè)在私有云中結(jié)合HPC和虛擬化技術(shù)的系統(tǒng),被用于進(jìn)行大規(guī)模的數(shù)據(jù)分析。這種以數(shù)據(jù)為中心的虛擬系統(tǒng)方法,大大降低了用戶訪問HPC解決方案的障礙和風(fēng)險(xiǎn)。
看到這里,你會(huì)不會(huì)覺得NCCS“財(cái)大氣粗”,直接新建平臺,大手一揮說干就干?
重點(diǎn)來了,ADAPT最亮眼的地方就在于,它實(shí)現(xiàn)了IT資源的循環(huán)利用。平臺由退役的HPC部件建造,而這些部件正是來自于Discover升級后的舊設(shè)備。
這些被重新利用的設(shè)備包括數(shù)百臺戴爾易安信PowerEdge C6100服務(wù)器,它們?yōu)锳DAPT提供了大部分的計(jì)算節(jié)點(diǎn)。
*戴爾易安信PowerEdge服務(wù)器搭載英特爾®至強(qiáng)®系列可擴(kuò)展處理器,在核心、緩存、內(nèi)存以及I/O方面進(jìn)行了大量優(yōu)化,使得其在整體性能上有了大的提升,可滿足多種工作負(fù)載需求。
NCCS的做法很聰明,可謂是“一箭雙雕”。
一方面,這種處理方式對環(huán)境非常友好。在綠色環(huán)保已成為全球趨勢的大背景下,妥善處理舊HPC設(shè)備,為IT產(chǎn)品的再利用進(jìn)行了積極正向的示范。
另一方面,這種行為盤活了現(xiàn)有資源,利用舊設(shè)備組建的ADAPT切實(shí)解決了中心對數(shù)據(jù)分析的需求,同時(shí)沒有產(chǎn)生較大的成本開支。
仔細(xì)觀察,我們會(huì)發(fā)現(xiàn),ADAPT當(dāng)前表現(xiàn)為一個(gè)類似于平臺即服務(wù)(PaaS)云的托管虛擬機(jī)(VM)環(huán)境。
它重要的特點(diǎn)是通過存儲(chǔ)、計(jì)算、網(wǎng)絡(luò)和云計(jì)算能力的架構(gòu)組合,實(shí)現(xiàn)大規(guī)模數(shù)據(jù)分析。這使科學(xué)家能夠快速創(chuàng)建分析應(yīng)用程序,將其移植到一個(gè)非常大的資源上,并能夠訪問龐大的模型和觀測數(shù)據(jù)集。
在該資源的中心是一個(gè)大型的并行文件系統(tǒng),擁有大約8PB的配置存儲(chǔ)。圍繞著存儲(chǔ)的是一朵高性能計(jì)算資源云,它有許多處理核心和大內(nèi)存,并借助InfiniBand網(wǎng)絡(luò)與存儲(chǔ)相連。
通過使用單根輸入/輸出虛擬化(SR-IOV)等技術(shù),ADAPT可以在計(jì)算資源上配置虛擬系統(tǒng),與存儲(chǔ)和其他虛擬系統(tǒng)進(jìn)行高速的網(wǎng)絡(luò)連接。
為ADAPT提供了大部分計(jì)算節(jié)點(diǎn)的戴爾易安信PowerEdge C6100,具有容量大、性能強(qiáng)和靈活度高等優(yōu)點(diǎn),并且采用高密度封裝。其高效的2U機(jī)架式機(jī)箱最多可支持12個(gè)3.5英寸或24個(gè)2.5英寸熱插拔SAS、SATA或固態(tài)硬盤。
即便是退役后再上崗,PowerEdge服務(wù)器依舊“能打”,能實(shí)現(xiàn)單節(jié)點(diǎn)可維護(hù)性以及熱插拔硬盤靈活性,為數(shù)據(jù)密集型科學(xué)應(yīng)用程序提供堅(jiān)實(shí)的基礎(chǔ)架構(gòu)。
在PowerEdge服務(wù)器的強(qiáng)力“助攻”下,ADAPT使科學(xué)家們能夠隨時(shí)訪問大量數(shù)據(jù)集和強(qiáng)大的計(jì)算資源,并獲得了HPCwire讀者選擇獎(jiǎng)——數(shù)據(jù)密集型系統(tǒng)(以終端用戶為中心)。