cluslab / metastack

Metastack: an enhanced and performance optimized version of Slurm
GNU General Public License v2.0
49 stars 15 forks source link

节能的配置和Slurm Power Saving配置一样吗? #10

Open ddzhang2020 opened 11 months ago

ddzhang2020 commented 11 months ago

如果和Slurm Power Saving配置不一样,请告知节能具体怎么配置。

cluslab commented 3 months ago

1、MetaStack对节能功能进行了强化,引入了"保留一部分状态为idle的节点不关机"功能,避免作业提交后,等待较长时间才能开始计算。 2、配置方式

POWER SAVE SUPPORT FOR IDLE NODES

全局配置 slurm.conf中: SuspendProgram=/opt/metastack/etc/powersave/suspend.sh #关机脚本 SuspendTimeout=900 # 发出节点关机请求和关闭节点之间允许的最长时间(秒) SuspendRate=20 # 将节点置于省电模式的速率。该值是每分钟的节点数,可用于防止功耗大幅下降 SuspendTime=1200 # 处于空闲或停机状态达此秒数的节点将被SuspendProgram置于节能模式。 SuspendExcNodes =k20r1n00 # 排除的节点 SuspendExcParts=kshctest01 # 排除的分区 ResumeFailProgram=/opt/gridview/slurm/etc/powersave/failToResume.sh #开机失败处理脚本 ResumeProgram=/opt/gridview/slurm/etc/powersave/resume.sh # 开机脚本 ResumeTimeout=1800 # 发出节点唤醒请求和唤醒节点之间允许的最长时间(秒) ResumeRate=20 # 将节点唤醒的速率,该值是每分钟的节点数 SuspendDefIdlePerPart=30 # 默认每个分区保留idle节点数,不会处于节能状态

自定义配置 分区配置中: SuspendIdleNum=100 # 设置分区保留idle节点数,不会处于节能状态;可覆盖全局的SuspendDefIdlePerPart

cluslab commented 3 months ago

更多相关信息,可以浏览我们的社区:https://www.cluslab.cn/