多语言展示
当前在线:245今日阅读:167今日分享:16

如何进行高性能计算系统的建设

进行高性能计算系统的建设,应该考虑哪些方面的影响因素,如何做好评估?
方法/步骤
1

高性能计算系统评估与建设的流程大概是:确定业务需求,评估基础设施,评估设备资源,评估人力资源,落地与实施。

2

数据中心基础设施是保证后期系统稳定运行的基石。根据业务需求评估与设计基础设施方案,合理实施基础设施建设或改造(自建+租用)。

3

设备资源评估主要是根据业务需求、成本预算框架,参考累计的设备测试与设备选型库,选择使用的系统架构模块以及设备类型。

4

人力资源评估主要是订立建设运维与人力资源标准,根据标准评估建设与运维所需人力资源。人力资源也可以考虑借助外部资源。

5

基础设施需要关注用电、UPS、制冷、承重、园区及电信运营商网络等,设备资源需关注远程可维护性、密度、能耗,厂商支持与服务等。

6

监控模块需要定制监控脚本与程序,主要通过IPMI, redfish接口监控温度,能耗等信息,通过告警网关发送邮件,短息与电话告警。

7

通过基于调度系统海量JOB日志数据( JOB特征分析与学习),全系统海量监控数据(系统效能关联分析与学习)的用户行为分析、智能运维与智能调度可以高效支撑运维分析。

推荐信息