slurm常用命令

slurm常用命令,slurm调度指令

应用介绍

(1)下线节点(禁止运行新作业) (2)上线节点(允许运行新作业) (3)节点清空(清理已运行作业) (4)节点恢复(恢复Idle或Alloc状态) 账户关联 所谓关联(association),是指由每个作业可以唯一确定一个四元组: 。关联的信息保存在系统记账数据库中。 cluster 是作业所在的高性能计算机系统的名字,即系统配置文件中 ClusterName 参数的值。多个高性 能计算机系统可以使用一个记账数据库,cluster 用于区分不同系统上的关联。 account 即作业所使用的帐号。帐号用于对系统中的用户进行组织,以进行利用统计、收费等。 user 即提交作业的用户。在确定关联时,使用用户的名字而不是用户 UID 进行识别。同一个用户的不同 作业可以使用不同的帐号。 partition 即作业所在的分区。如果关联的 partition 域为空,表示任意分区。 预期的操作模式是启动sacctmgr命令,添加,删除,修改和/或列出关联记录,然后提交更改并退出。 scontrol update nodename=gv21 state=drain reason=“hardware error” scontrol update nodename=gv21 state=idle scontrol update nodename=gv21 state=down reason=“debug” scontrol update nodename=gv21 state=resume

文件列表(部分)

名称 大小 修改日期
slurm常用命令.pdf938.20 KB2021-09-19

立即下载

相关下载

[slurm常用命令] slurm常用命令,slurm调度指令

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部