sic-khu / sichpc

0 stars 0 forks source link

워커노드 하드디스크 사용 여부 #18

Closed jhgoh closed 2 months ago

jhgoh commented 2 months ago

워커노드의 root 여유공간을 추가로 사용할 수 있는가 문의에 대한 대응 중 다음 issue 제기됨

현재 노드의 파일시스템은 ramdisk를 사용중인 것으로 보임 (tmpfs)

[root@gpu01 ~]# df -h /
Filesystem      Size  Used Avail Use% Mounted on
tmpfs            63G   41G   22G  66% /

실제 노드별로 설치된 하드디스크가 실제로는 사용되지 않고 있는 것으로 보임. 아래는 fdisk -l 실행 결과

gpu01: Disk /dev/sda: 446.6 GiB, 479559942144 bytes, 936640512 sectors
gpu01: Units: sectors of 1 * 512 = 512 bytes
gpu01: Sector size (logical/physical): 512 bytes / 512 bytes
gpu01: I/O size (minimum/optimal): 262144 bytes / 262144 bytes
gpu01: Disklabel type: gpt
gpu01: Disk identifier: 8183A160-036B-4DB3-8543-B8D18C35A622
gpu01: 
gpu01: Device      Start     End Sectors  Size Type
gpu01: /dev/sda1    2048  514047  512000  250M EFI System
gpu01: /dev/sda2  514048 4708351 4194304    2G Microsoft basic data

/dev/sda2를 살펴보면 800GB 볼륨이 보이나, 실제로 해당 디바이스는 잡히지 않음.

gpu01: Disk /dev/sda2: 2 GiB, 2147483648 bytes, 4194304 sectors
gpu01: Partition 1 does not start on physical sector boundary.
gpu01: Units: sectors of 1 * 512 = 512 bytes
gpu01: Sector size (logical/physical): 512 bytes / 512 bytes
gpu01: I/O size (minimum/optimal): 262144 bytes / 262144 bytes
gpu01: Disklabel type: dos
gpu01: Disk identifier: 0x500a0dff
gpu01: 
gpu01: Device      Boot      Start        End    Sectors   Size Id Type
gpu01: /dev/sda2p1      1948285285 3650263507 1701978223 811.6G 6e unknown
gpu01: /dev/sda2p2               0          0          0     0B 74 unknown
gpu01: /dev/sda2p4        28049408   28049848        441 220.5K  0 Empty
gpu01: 
gpu01: Partition table entries are not in disk order.

업체에 문의 예정.

chyoo92 commented 2 months ago

각 gpu노드별 /tmpdata에 440G 가량 데이터 공간 확보됨 (/tmp 폴더아래에 저장했던것처럼 서버 재부팅되도 데이터가 날아가지 않음)

chyoo92 commented 2 months ago

마스터 노드와 gpu 노드는 1G에서 낼수있는 최대 속도가 나오고 있음. 다만 gpu의 계산량이 많을경우 네트워크 속도가 충분하지 않다. 해결 하려면 10G로 올리거나, 각 노드별 /tmpdata 폴더에 저장해서 사용해야 함