Open L-YW opened 2 years ago
$ sudo apt update
$ sudo apt install slurm-wlm
$ sudo apt install slurm-wlm-doc
$ sudo vim /lib/systemd/system/slurmctld.service
PIDFile=/var/run/slurm-llnl/slurmctld.pid
$ sudo vim /lib/systemd/system/slurmd.service PIDFile=/var/run/slurm-llnl/slurmd.pid
- And then,
$ sudo dpkg -L slurm-wlm-doc
- ```configurator.easy.html``` 위치 확인 후 다음 명령 실행
$ firefox /usr/share/doc/slurm-wlm/html/configurator.easy.html
- 웹브라우저 화면에서 다음과 같이 입력 또는 선택
Control Machine SlurmctldHost --> 'hostname' Compute Machine NodeName --> 'hostname' NodeAddr --> empty PartitionName --> jobs MaxTime --> INFINITE
CPUs --> 사용가능 CPU 수 (core * thread) Sockets --> board 상 physical chip의 수 CorePerSocket --> cores per one physical CPU chpis ThreadsPerCore --> number of thread per core RealMemory --> from slurmd -C
Slurm User SlurmUser --> slurm
State Preservation StateSaveLocation --> /var/lib/slurm-llnl/slurmctld SlurmdSpoolDir --> /var/lib/slurm-llnl/slurmd ReturnToService --> 1
Scheduling SchedulerType --> Backfill
Interconnect SwitchType --> None
Default MPI TYpe MpiDefault --> None
Process Tracking ProctrackType --> Pgid
Resource Selection SelectType --> Linear
SelectTypeParameters # works only for non Linear
Task Launch --> None
Event Logging SlurmctldLogFile --> /var/log/slurm-llnl/slurmctld.log SlurmdLogFile --> /var/log/slurm-llnl/slurmd.log
Job Accounting Gather AccountingStorageType --> None
ClusterName --> cluster
Process ID Logging SlurmctldPidFile --> /var/run/slurm-llnl/slurmctld.pid SlurmdPidFile --> /var/run/slurm-llnl/slurmd.pid
- CPU 확인 ```slurmd -C```
- Hostname에는 ```/etc/hosts``` 파일 내에 있는 127.0.1.1 의 이름 사용
- ```/etc/hostname```을 127.0.1.1의 이름(ex. ruby)으로 변경
PRETTY_HOSTNAME=ruby
- 웹페이지 입력사항을 모두 입력한 후 ```submit``` 클릭 후 변경 된 화면에 나온 내용을 복사 후
- ```/etc/slurm0llnl/slurm.conf```에 붙여넣기
$ sudo vim /etc/slurm-llnl/slurm.conf
- 그리고 아래와 같이 파일을 수정
$ cd /usr/lib/tmpfiles.d $ sudo vim slurm.conf
d /var/run/slurm-llnl 0775 slurm slurm -
- 다음의 명령을 실행하여 에러 메세지가 없이 진행되는지 확인
$ slurmctld -Dcvvv
sudo su -
dd if=/dev/urandom of=/etc/munge/munge.key bs=1c count=4M
$ ls -l /etc/munge/munge.key
$ chmod a-r /etc/munge/munge.key
$ chmod u-w /etc/munge/munge.key
$ chmod u+r /etc/munge/munge.key
$ sudo chown munge:munge /etc/munge/munge.key
slurmctld
와 slurmd
실행$ sudo systemctl start slurmctld
$ sudo systemctl start slurmd
$ sudo systemctl status slurmctld
slurmctld.service - Slurm controller daemon
Loaded: loaded (/lib/systemd/system/slurmctld.service; enabled; vendor preset: enabled)
Active: active (running) since Mon 2020-08-03 20:39:07 KST; 45min ago
Docs: man:slurmctld(8)
.
.
.
active (running)
이 나오면 정상 설치
(출처 : http://luxnox.iptime.org/blog/ubuntu-20-4-%EC%97%90-slurm-%EC%8A%A4%EC%BC%80%EC%A4%84%EB%9F%AC-%EC%84%A4%EC%B9%98%ED%95%98%EA%B8%B0/)