Slurm の使い方と方針

  • 使い方
  • 利用方針
  • 使い方の例

Slurm とは

  • ジョブスケジューラーである
  • リソースへの競合を解決してくれる

Slurm の使い方 (1)

Slurm の利用方針

利用方針は 計算リソースの利用効率を上げること を重視します。以下は方針に対する重要な項目となります。

  • Jobの優先順位
    • 要求するリソースの少ないJobの優先度を高くする
    • 実行時間の記載がない場合は優先度が低くなる可能性がある
    • これまでのJobの実行履歴で優先度は変化しない
  • Jobの実行時間
    • Jobの実行時間の記載がない場合は1日で強制終了させる
    • 実行時間が長すぎてリソース過多のJobは、実行待ちのJobが多い場合、確認後に強制終了される可能性がある

優先度に対する注意点

要求するリソースが多い場合は優先度が低くなります。そのため、Jobが一向に実行されない場合があります。その時はシステム管理チームへご連絡ください。

  • Mattermost
    • ie-syskan チャンネル
  • Mail
    • sys-admin@ie.u-ryukyu.ac.jp

Sbatch のオプション (1)

前述した利用方針で重要となるオプションを説明します。

  • 名前
    • Jobの名前になります
#SBATCH --job-name [JOB_NAME]
  • ログ
    • 標準出力と標準エラーの設定です
    • 指定したファイルに書き込まれます
#SBATCH --output logs/%x-%j.log
#SBATCH --error logs/%x-%j.err

Sbatch のオプション (2)

  • ノード
    • 要求するノードの数を指定します
#SBATCH --nodes 1
  • リソース
    • Jobに必要なCPUの数、GPUの数を指定します
    • 1つのノードで指定できる数
      • CPU 88
      • GPU 1
    • これ以上のリソースを要求する場合は--nodesも増やす必要があります
#SBATCH --cpus-per-task 8
#SBATCH --gpus tesla:1

Sbatch のオプション (3)

  • 実行時間
    • Jobの実行にかかる時間を指定します
    • 指定方法
      1. minutes
      2. minutes:seconds
      3. hours:minutes:seconds
      4. days-hours
      5. days-hours:minutes
      6. days-hours:minutes:seconds
#SBATCH --time 01:00

バッチファイルの例

  • リソース要求
    • CPUの要求を 8コア
    • GPUを1台
    • 実行時間は1分以内
  • バッチファイルの中身
#!/bin/bash
#SBATCH --job-name hostname
#SBATCH --output logs/%x-%j.log
#SBATCH --error logs/%x-%j.err
#SBATCH --nodes 1
#SBATCH --cpus-per-task 8
#SBATCH --gpus tesla:1
#SBATCH --time 01:00

hostname

コメント:画像を中央に配置する centerコマンドを有効に