Closed jhgoh closed 7 months ago
Full-load 상태에서 GPU job 효율이 떨어지는 것을 확인함. mewtwo에서 GPU job은 실행중이었음. (training epoch 100중 약 40-50정도 진행상태)
hep server 에서 disk read시의 대역폭 한계 때문으로 추정. (hep:sdb에서 읽기 속도 약 60MB/s)
모니터링 중 특이사항을 남기는 것으로 문제 자체는 아니므로 이 issue는 바로 close함.
Full-load 상태에서 GPU job 효율이 떨어지는 것을 확인함. mewtwo에서 GPU job은 실행중이었음. (training epoch 100중 약 40-50정도 진행상태)
hep server 에서 disk read시의 대역폭 한계 때문으로 추정. (hep:sdb에서 읽기 속도 약 60MB/s)