Closed jhgoh closed 2 months ago
워커노드의 root 여유공간을 추가로 사용할 수 있는가 문의에 대한 대응 중 다음 issue 제기됨
현재 노드의 파일시스템은 ramdisk를 사용중인 것으로 보임 (tmpfs)
[root@gpu01 ~]# df -h / Filesystem Size Used Avail Use% Mounted on tmpfs 63G 41G 22G 66% /
실제 노드별로 설치된 하드디스크가 실제로는 사용되지 않고 있는 것으로 보임. 아래는 fdisk -l 실행 결과
gpu01: Disk /dev/sda: 446.6 GiB, 479559942144 bytes, 936640512 sectors gpu01: Units: sectors of 1 * 512 = 512 bytes gpu01: Sector size (logical/physical): 512 bytes / 512 bytes gpu01: I/O size (minimum/optimal): 262144 bytes / 262144 bytes gpu01: Disklabel type: gpt gpu01: Disk identifier: 8183A160-036B-4DB3-8543-B8D18C35A622 gpu01: gpu01: Device Start End Sectors Size Type gpu01: /dev/sda1 2048 514047 512000 250M EFI System gpu01: /dev/sda2 514048 4708351 4194304 2G Microsoft basic data
/dev/sda2를 살펴보면 800GB 볼륨이 보이나, 실제로 해당 디바이스는 잡히지 않음.
/dev/sda2
gpu01: Disk /dev/sda2: 2 GiB, 2147483648 bytes, 4194304 sectors gpu01: Partition 1 does not start on physical sector boundary. gpu01: Units: sectors of 1 * 512 = 512 bytes gpu01: Sector size (logical/physical): 512 bytes / 512 bytes gpu01: I/O size (minimum/optimal): 262144 bytes / 262144 bytes gpu01: Disklabel type: dos gpu01: Disk identifier: 0x500a0dff gpu01: gpu01: Device Boot Start End Sectors Size Id Type gpu01: /dev/sda2p1 1948285285 3650263507 1701978223 811.6G 6e unknown gpu01: /dev/sda2p2 0 0 0 0B 74 unknown gpu01: /dev/sda2p4 28049408 28049848 441 220.5K 0 Empty gpu01: gpu01: Partition table entries are not in disk order.
업체에 문의 예정.
각 gpu노드별 /tmpdata에 440G 가량 데이터 공간 확보됨 (/tmp 폴더아래에 저장했던것처럼 서버 재부팅되도 데이터가 날아가지 않음)
마스터 노드와 gpu 노드는 1G에서 낼수있는 최대 속도가 나오고 있음. 다만 gpu의 계산량이 많을경우 네트워크 속도가 충분하지 않다. 해결 하려면 10G로 올리거나, 각 노드별 /tmpdata 폴더에 저장해서 사용해야 함
워커노드의 root 여유공간을 추가로 사용할 수 있는가 문의에 대한 대응 중 다음 issue 제기됨
현재 노드의 파일시스템은 ramdisk를 사용중인 것으로 보임 (tmpfs)
실제 노드별로 설치된 하드디스크가 실제로는 사용되지 않고 있는 것으로 보임. 아래는 fdisk -l 실행 결과
/dev/sda2
를 살펴보면 800GB 볼륨이 보이나, 실제로 해당 디바이스는 잡히지 않음.업체에 문의 예정.