L-YW / paraview_exam

Paraview Simple Example
0 stars 0 forks source link

Ubuntu에 SLURM 스케줄러 설치하기 #4

Open L-YW opened 2 years ago

L-YW commented 2 years ago

(출처 : http://luxnox.iptime.org/blog/ubuntu-20-4-%EC%97%90-slurm-%EC%8A%A4%EC%BC%80%EC%A4%84%EB%9F%AC-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0/)

L-YW commented 2 years ago

1. SLURM 설치

PIDFile=/var/run/slurm-llnl/slurmctld.pid

$ sudo vim /lib/systemd/system/slurmd.service PIDFile=/var/run/slurm-llnl/slurmd.pid

- And then,

$ sudo dpkg -L slurm-wlm-doc

- ```configurator.easy.html``` 위치 확인 후 다음 명령 실행

$ firefox /usr/share/doc/slurm-wlm/html/configurator.easy.html

- 웹브라우저 화면에서 다음과 같이 입력 또는 선택

Control Machine SlurmctldHost --> 'hostname' Compute Machine NodeName --> 'hostname' NodeAddr --> empty PartitionName --> jobs MaxTime --> INFINITE

CPUs --> 사용가능 CPU 수 (core * thread) Sockets --> board 상 physical chip의 수 CorePerSocket --> cores per one physical CPU chpis ThreadsPerCore --> number of thread per core RealMemory --> from slurmd -C

Slurm User SlurmUser --> slurm

State Preservation StateSaveLocation --> /var/lib/slurm-llnl/slurmctld SlurmdSpoolDir --> /var/lib/slurm-llnl/slurmd ReturnToService --> 1

Scheduling SchedulerType --> Backfill

Interconnect SwitchType --> None

Default MPI TYpe MpiDefault --> None

Process Tracking ProctrackType --> Pgid

Resource Selection SelectType --> Linear

SelectTypeParameters # works only for non Linear

Task Launch --> None

Event Logging SlurmctldLogFile --> /var/log/slurm-llnl/slurmctld.log SlurmdLogFile --> /var/log/slurm-llnl/slurmd.log

Job Accounting Gather AccountingStorageType --> None

ClusterName --> cluster

Process ID Logging SlurmctldPidFile --> /var/run/slurm-llnl/slurmctld.pid SlurmdPidFile --> /var/run/slurm-llnl/slurmd.pid

- CPU 확인 ```slurmd -C```
- Hostname에는 ```/etc/hosts``` 파일 내에 있는 127.0.1.1 의 이름 사용
- ```/etc/hostname```을 127.0.1.1의 이름(ex. ruby)으로 변경

PRETTY_HOSTNAME=ruby

- 웹페이지 입력사항을 모두 입력한 후 ```submit``` 클릭 후 변경 된 화면에 나온 내용을 복사 후
- ```/etc/slurm0llnl/slurm.conf```에 붙여넣기

$ sudo vim /etc/slurm-llnl/slurm.conf

- 그리고 아래와 같이 파일을 수정

$ cd /usr/lib/tmpfiles.d $ sudo vim slurm.conf

Directory for slurmctld sockets, lockfiles and stats tempfiles

d /var/run/slurm-llnl 0775 slurm slurm -

- 다음의 명령을 실행하여 에러 메세지가 없이 진행되는지 확인

$ slurmctld -Dcvvv

L-YW commented 2 years ago

2. MUNGE 설치

sudo su -
dd if=/dev/urandom of=/etc/munge/munge.key bs=1c count=4M

3. slurmctldslurmd 실행

$ sudo systemctl start slurmctld
$ sudo systemctl start slurmd
$ sudo systemctl status slurmctld

slurmctld.service - Slurm controller daemon
   Loaded: loaded (/lib/systemd/system/slurmctld.service; enabled; vendor preset: enabled)
   Active: active (running) since Mon 2020-08-03 20:39:07 KST; 45min ago
   Docs: man:slurmctld(8)
   .
   .
   .