機能と特徴
Platform LSFの機能と特徴
- クラスタ管理
- ジョブスケジューリング
- ジョブ管理
- キューの設定
- 耐障害性(フェールオーバ)
クラスタ管理
クラスタは、LSFの構成単位で、管理サーバと実行ホストから構成されます。
管理サーバは、一定間隔でクラスタ内にあるITリソース(CPU,メモリ,DISK等)の負荷状態を監視します。
クラスタ内のマシンからジョブを投入したり、ジョブを実行することができます。
監視項目の例: CPU使用率、使用可能なメモリ量、ディスクI/O率 等
ジョブスケジューリング
クラスタにジョブが投入されると、管理サーバは、キュー設定や各マシン負荷状況に応じた
最適なホストでのジョブ実行をスケジューリングします。
- FCFS(デフォルト)
投入された順に処理されます。
- FAIRSHARE
現在の実行状態と過去のCPU使用実績を元に、ユーザあるいはユーザグループ間で公平に配分します。
- PREEMPTON
優先度に応じてジョブ割り込みを許可します。
- BACKFILL
パラレルジョブ投入時、指定したCPU数が確保できるまでの待ち時間を他の短いジョブの実行に利用します。
- EXCLUSIVE
特定のホストを独占使用します。
ジョブ管理
クラスタ内に投入されたジョブを管理します
- ジョブ情報の表示(状態、キュー、投入・実行ホスト名、履歴)
- ジョブ操作(トップ配置、ボトム配置)
- ジョブオプション修正
- キュー切換え
- ジョブ中断
キューの設定
キューとは、ジョブ制御ポリシーを指します。
- 実行ホスト、ホストグループ
- 投入可能なユーザ、グループ
- 実行時間帯、曜日(タイムウィンドー)
- リソース制限値(CPU、メモリ、DISK)
耐障害性(フェールオーバ)
LSFには、実行ホストと管理サーバのフェールオーバ機能があります。
- 実行ホストのフェールオーバ
ジョブ実行中ホストに障害が発生した場合、自動的に他のホストで実行されます。
アプリケーションのチェックポイント機能を利用することにより、計算途中からリスタート可能です。
- 管理サーバのフェールオーバ
管理サーバ(プライマリ)に障害が発生した場合、予め指定された他の管理サーバ(セカンダリ)に管理機能が移行されます。
お問い合わせ先
NECソフト株式会社
0120-632-364(フリーダイヤル)※携帯・自動車電話・PHSからもご利用になれます。
受付時間 9:00~19:00(土日・祝日は除く)/E-mail: info@necsoft.com









