支撐平臺
支撐平臺
高性能計算機集群系統
儀器型號:曙光5000計算機集群
購置年月:2011年9月
儀器簡(jiǎn)介:
曙光5000高效能計算機力求在體系結構、多處理機芯片組、高性能節點(diǎn)操作系統、高可擴展互連網(wǎng)絡(luò )、高吞吐率通信軟件、多線(xiàn)程分割全局地址空間編程模型及編譯器等核心技術(shù)上實(shí)現較大突破;并提供高效能計算機的高密度節點(diǎn)、可靠的系統結構、虛擬化軟件、高效能海量存儲、并行文件系統、大規模系統的管理軟件、系統級?mèng)敯粜约夹g(shù)、超大規模并行算法等產(chǎn)品及技術(shù),從而實(shí)現系統的高性能、可編程性、可移植性和穩定性,并服務(wù)于未來(lái)超算中心能力計算(Capability Computing)和容量計算(Capacity Computing)兩類(lèi)應用。
曙光5000A基于高密服務(wù)器構成的“超并行”體系結構(Hyper Parallel Processing,簡(jiǎn)稱(chēng)HPP);
峰值運算能力20Tflops CPU計算性能+50Tflops GPU計算性能,存儲能力96TB并行存儲系統+20TB備份存儲系統。
應用范圍:
1. 高性能計算應用范圍:先進(jìn)制造、電子信息、環(huán)境工程、裝備制造、通信工程、光電工程、土木工程、軟件工程、流體力學(xué)計算、生物工程和農學(xué)、基因工程、電子信息工程、基因工程、生物醫學(xué)、車(chē)輛工程、化學(xué)工程、數字城市、數字工程、影視動(dòng)畫(huà)設計、三維動(dòng)畫(huà)、特效制作、游戲引擎開(kāi)發(fā)等、天氣預報、氣象災害評估、地理信息系統、海量遙感數據處理等;
高性能計算技術(shù)作為基礎工具,為各個(gè)學(xué)科行業(yè)以多種方式提供支持,提高生產(chǎn)力和創(chuàng )新能力,包括:
(1)基礎學(xué)科中深入的知識發(fā)現,問(wèn)題規模的擴大和求解精度的增加需要更高性能的計算資源。例如,計算流體力學(xué)、計算材料學(xué)、計算電磁學(xué)。
(2)多學(xué)科綜合設計領(lǐng)域中,大量的多部門(mén)協(xié)同計算需要構建高性能的綜合平臺。例如,汽車(chē)設計、船舶設計。
(3)基于仿真的工程科學(xué)結合傳統工程領(lǐng)域的知識技術(shù)與高性能計算,提供經(jīng)濟高效地設計與實(shí)踐方法。例如,基于仿真的醫學(xué)實(shí)踐、數字城市模擬、核電、油田仿真工具、新材料開(kāi)發(fā)、碰撞仿真技術(shù)、數字風(fēng)洞。
(4)高性能計算提升眾多行業(yè)服務(wù)、決策的時(shí)效性,提高經(jīng)濟效益。例如,實(shí)時(shí)天氣預報、城市交通控制、視頻點(diǎn)播服務(wù)、動(dòng)漫設計、網(wǎng)絡(luò )游戲、基于RFID的貨物跟蹤、智能電子商務(wù)。
(5)數據密集型應用需要高性能數據處理,以應對數據爆炸式增長(cháng)帶來(lái)的難題。例如,高能物理實(shí)驗數據處理、遙感數據處理、商業(yè)智能、生物信息學(xué)、RFID數據挖掘、金融業(yè)分析抵押借貸、移動(dòng)電話(huà)流量分析。
2. 云計算應用范圍:IAAS硬件虛擬化云服務(wù)、云災備、云存儲、云安全、云融合等標準化云服務(wù)和研究。
技術(shù)參數:
曙光高性能計算集群系統配置清單 | ||||
序號 |
名稱(chēng) |
技術(shù)規格 |
單位 |
數量 |
1 |
硬件部分 | |||
1.1 |
計算子系統 | |||
1.1.1 |
高性能計算分區 | |||
刀片平臺 |
曙光TC3600 |
10U機架式刀片機箱,可以支持10個(gè)計算刀片; |
套 |
7 |
計算刀片 |
曙光CB65-G |
2*AMD Opteron 6172 12核處理器 (2.1GHz); |
片 |
64 |
SMP胖節點(diǎn) |
曙光A840-G |
4*AMD Opteron 6172 12核處理器 (2.1GHz); |
臺 |
4 |
科學(xué)計算加速器(GPGPU) |
第一性原理計算 |
4U標準機架式設備 |
臺 |
6 |
分子動(dòng)力學(xué)計算 |
4U標準機架式設備 |
臺 |
10 | |
計算容錯模塊 |
曙光CluSnap |
4U標準機架式設備; |
套 |
2 |
1.1.2 |
云服務(wù)分區 | |||
云服務(wù)節點(diǎn) |
曙光A840-G |
4*AMD Opteron 6172 12核處理器 (2.1GHz); |
臺 |
8 |
1.1.3 |
協(xié)同設計分區 | |||
工作站節點(diǎn) |
曙光W580I |
4U機塔互換式; |
臺 |
10 |
1.1.4 |
安全隔離分區 | |||
刀片平臺 |
曙光TC3600 |
10U機架式刀片機箱,可以支持10個(gè)計算刀片; |
套 |
1 |
計算刀片 |
曙光CB65-G |
2*AMD Opteron 6172 12核處理器 (2.1GHz); |
片 |
10 |
SMP胖節點(diǎn) |
曙光A840-G |
4*AMD Opteron 6172 12核處理器 (2.1GHz); |
臺 |
1 |
1.2 |
管理控制子系統 | |||
集群管理/監控節點(diǎn) |
曙光CB65-G |
2*AMD Opteron 6128 8核處理器 (2.0GHz); |
臺 |
1 |
IB子網(wǎng)管理節點(diǎn) |
曙光CB65-G |
2*AMD Opteron 6128 8核處理 (2.0GHz); |
臺 |
1 |
功能節點(diǎn)(NIS、NTP、FTP、作業(yè)調度、License) |
曙光CB65-G |
2*AMD Opteron 6128 8核處理器 (2.0GHz); |
臺 |
2 |
登錄節點(diǎn)(分區) |
曙光CB65-G |
2*AMD Opteron 6128 8核處理器 (2.0GHz); |
臺 |
2 |
登錄節點(diǎn)(分區) |
曙光A620r-G |
2U機架式; |
臺 |
2 |
1.3 |
安全控制子系統 | |||
安全認證服務(wù)器 |
曙光SecServer750 |
5U機塔互換設計,1顆Xeon E5506處理器,2G DDR3內存,500G SATA 2硬盤(pán),DVD-ROM,專(zhuān)用高性能加密卡,加密認證軟件光盤(pán),具有CA認證、簽名、單機登錄等功能,與Nikey結合組成身份認證解決方案,擁有國家密碼管理局認證。 |
臺 |
1 |
網(wǎng)絡(luò )審計設備 |
曙光NetFirm-A1600 |
6個(gè)千兆口,4個(gè)光口,2U機架,冗余電源,實(shí)現網(wǎng)絡(luò )內容與行為審計,支持網(wǎng)站過(guò)濾、聊天監控、郵件監控、行為管理、日志審計等功能,并發(fā)連接數250萬(wàn),吞吐量4.5G,用戶(hù)數5000個(gè) |
臺 |
1 |
網(wǎng)絡(luò )防火墻 |
龍芯防火墻C10TLFW-1000L |
并發(fā)連接數100萬(wàn),吞吐量1G,VPN隧道數600 |
臺 |
2 |
智能密鑰 |
曙光NiKey100 |
曙光NiKey100智能密碼鑰匙,保證身份認證安全。與曙光GridView、防火墻VPN配合使用。 |
個(gè) |
100 |
1.4 |
存儲子系統 | |||
并行存儲系統Parastor(高性能計算分區) |
P100-MDC(數據索引控制器) |
高性能64位處理器,24GB Cache,1個(gè)管理網(wǎng)絡(luò )端口,2個(gè)1Gb接入端口,1個(gè)40Gb QDR IB高速接入端口,冗余電源,內嵌高性能數據索引引擎,實(shí)現單一全局命名空間,管理多客戶(hù)端的并行訪(fǎng)問(wèn),支持雙機熱備 |
臺 |
2 |
P100-IOM(數據存取模塊) |
高性能64位處理器,24GB Cache,1個(gè)管理網(wǎng)絡(luò )端口,2個(gè)1Gb存取端口,1個(gè)40Gb QDR IB高速存取端口,冗余電源,內嵌高性能數據存取引擎,并行處理所有客戶(hù)端的數據訪(fǎng)問(wèn)請求,自動(dòng)負載均衡,支持按需動(dòng)態(tài)擴展,支持雙機熱備 |
臺 |
4 | |
P100-SSU(智能存儲單元:64TB) |
高性能64位處理器,全冗余架構,1個(gè)管理網(wǎng)絡(luò )端口,支持多個(gè)RAID5、RAID6等RAID級別,支持SAS、SATA、SSD三種存儲介質(zhì),提供海量存儲空間,最大可擴展到1EB,支持多副本容錯,支持按需動(dòng)態(tài)在線(xiàn)擴展;實(shí)際配置裸容量64TB企業(yè)級SATA硬盤(pán)作為大容量存儲空間 |
套 |
1 | |
管理軟件 |
內嵌曙光并行存儲管理軟件系統,中文界面,圖形化顯示,實(shí)時(shí)監控并行存儲系統各組成模塊的運行狀態(tài)以及并行存儲系統的I/O性能 |
套 |
1 | |
并行存儲系統Parastor(安全隔離分區) |
P100-MDC(數據索引控制器) |
高性能64位處理器,24GB Cache,1個(gè)管理網(wǎng)絡(luò )端口,2個(gè)1Gb接入端口,1個(gè)40Gb QDR IB高速接入端口,冗余電源,內嵌高性能數據索引引擎,實(shí)現單一全局命名空間,管理多客戶(hù)端的并行訪(fǎng)問(wèn),支持雙機熱備 |
臺 |
2 |
P100-IOM(數據存取模塊) |
高性能64位處理器,24GB Cache,1個(gè)管理網(wǎng)絡(luò )端口,2個(gè)1Gb存取端口,1個(gè)40Gb QDR IB高速存取端口,冗余電源,內嵌高性能數據存取引擎,并行處理所有客戶(hù)端的數據訪(fǎng)問(wèn)請求,自動(dòng)負載均衡,支持按需動(dòng)態(tài)擴展,支持雙機熱備 |
臺 |
4 | |
P100-SSU(智能存儲單元:32TB) |
高性能64位處理器,全冗余架構,1個(gè)管理網(wǎng)絡(luò )端口,支持多個(gè)RAID5、RAID6等RAID級別,支持SAS、SATA、SSD三種存儲介質(zhì),提供海量存儲空間,最大可擴展到1EB,支持多副本容錯,支持按需動(dòng)態(tài)在線(xiàn)擴展;實(shí)際配置裸容量32TB企業(yè)級SATA硬盤(pán)作為大容量存儲空間 |
套 |
1 | |
管理軟件 |
內嵌曙光并行存儲管理軟件系統,中文界面,圖形化顯示,實(shí)時(shí)監控并行存儲系統各組成模塊的運行狀態(tài)以及并行存儲系統的I/O性能 |
套 |
1 | |
備份存儲系統 |
曙光Dbstor備份存儲系統 |
4U機架式,2個(gè)千兆網(wǎng)口,8GB緩存,20TB智能磁盤(pán),含重復數據刪除,企業(yè)版備份軟件,20個(gè)異構客戶(hù)端,840W 2+1冗余電源 |
臺 |
1 |
光纖交換機 |
博科24端口光纖交換機 |
BR-360-0008-A,24端口交換機,24端口激活,單電源(固定),含24個(gè)8Gb短波SFP,含Web tools、Zoning軟件授權,支持級聯(lián),1年原廠(chǎng)保修(非現場(chǎng)) |
臺 |
1 |
1.5 |
網(wǎng)絡(luò )子系統 | |||
高速計算網(wǎng)絡(luò ) |
Mellanox MIS5100Q-3DNC QDR IB交換機 |
標配機箱:6U模塊化交換機機箱、最大可支持108口(6個(gè)頁(yè)板),機箱內包括3個(gè)內部交換模塊、3個(gè)自適應110/220V AC電源模塊(2+1冗余)、管理模塊、熱插拔風(fēng)扇模塊、上架套件 |
臺 |
1 |
Mellanox MIS5001QC 18口QSFP 40Gb/s IB頁(yè)板 |
18+18端口QSFP 40Gb/s IB頁(yè)板,芯片采用InfiniScale? IV,用于MIS5XXX系列交換機 |
臺 |
6 | |
Infiniband線(xiàn)纜 |
FreePort QSFP(QDR) IB線(xiàn)纜(QDR 4X QSFP-QSFP IB線(xiàn)纜) |
根 |
108 | |
千兆以太網(wǎng)絡(luò ) |
Force10 C150交換機 |
配置96個(gè)10/100/1000baseT銅接口,包括:1個(gè)標配機箱(含1個(gè)AC電源,1個(gè)路由交換模塊),2個(gè)48口1Gb RJ-45口以太網(wǎng)卡板,1份操作系統 |
臺 |
1 |
1.6 |
基礎架構子系統 | |||
曙光C1000散熱系統 |
空調室內機 |
曙光云座C1000氟冷水平送風(fēng)空調室內機模塊,最大顯冷量35KW,最大風(fēng)量7000m3/h,尺寸600*1200*2000mm |
臺 |
3 |
空調室外機 |
GMVL-Rm600W/D,制冷量60KW |
臺 |
3 | |
除塵除濕一體機 |
曙光云座除塵除濕一體機,除濕量5kg/h,過(guò)濾等級亞高效 |
臺 |
1 | |
機柜 |
曙光云座C1000封閉機柜,尺寸600*1200*2000mm,有效空間42U,靜載1000kg |
臺 |
12 | |
監控系統 |
C1000監控采集器 |
空調及機柜內部傳感器數據采集及上傳功能 |
套 |
1 |
C1000溫度探頭 |
測量機柜內部溫度 | |||
C1000溫濕一體探測器 |
測量機柜排冷、熱通道內微環(huán)境的溫度及濕度 | |||
C1000煙霧探測器 |
測量機柜冷、熱通道內微環(huán)境的煙霧濃度,預防火災隱患 | |||
C1000漏水探測器 |
測量空調室內機下部冷凝水漏水,防止漏水水災隱患 | |||
控制臺 |
曙光集群控制臺 |
1U手動(dòng)伸縮控制臺(曙光17”液晶顯示器、鼠標、鍵盤(pán)、8口切換器等) |
套 |
1 |
視頻切換系統 |
SKVM |
SKVM IV Over IP(包含鍵盤(pán)鼠標),CIM節點(diǎn)控制模塊 |
套 |
1 |
2 |
軟件部分 | |||
操作系統 |
Linux |
SuSE Linux 企業(yè)版 11.1 |
套 |
1 |
GPU編程環(huán)境 |
Nvidia GPU開(kāi)發(fā)環(huán)境 |
nvcc C語(yǔ)言編譯器 |
套 |
1 |
用于GPU(圖形處理器)的CUDA FFT以及BLAS庫 | ||||
分析器(Profiler) | ||||
用于GPU(圖形處理器)的gdb調試程序 | ||||
CUDA運行時(shí)驅動(dòng)程序 | ||||
云管理系統 |
曙光Cloudview |
曙光Cloudview云管理平臺,支持項目組織管理、計費管理、虛擬化管理、云安全管理等功能 |
套 |
1 |
集群管理系統 |
曙光GridView 2.5 |
GridView HPC版,支持系統部署、系統監控、集群管理、數據報表、統一告警、作業(yè)調度 |
套 |
1 |
GridView應用Portal,8個(gè)基本應用Portal,支持Ansys、Lsdyna、Abaqus、Fluent、Vasp、Gaussian、NAMD、Gromacs;4個(gè)定制應用Portal,根據用戶(hù)需求開(kāi)發(fā) |
套 |
1 | ||
GridView集群節能模塊PowerConf 2.0 |
套 |
1 | ||
應用開(kāi)發(fā)環(huán)境 |
編譯器 |
GNU 編譯器,支持C/C++ Fortran77/90 |
套 |
1 |
數學(xué)庫 |
BLAS、LAPACK、ScaLAPACK、FFTW |
套 |
1 | |
MPI并行環(huán)境 |
OpenMPI(支持Infiniband和以太網(wǎng)的MPI環(huán)境) |
套 |
1 | |
MPICH(支持千兆以太網(wǎng)的MPI環(huán)境) |
套 |
1 | ||
CPU峰值(Tflops) |
20.16 |
|
|
|
GPU峰值(Tflops) |
50.43 |
|
|
|