cpnr / computing

0 stars 0 forks source link

nfs 성능 저하 #19

Closed jhgoh closed 8 months ago

jhgoh commented 8 months ago

유저 사용중 응답 속도가 느린 것으로 보고됨.

문제 상황

ls나 vi 실행이 많이 느리고, positron simulation을 하는데 있어서 beamOn을 2개로 하여 rat을 실행시키면 foreground로 실행시켜봤을때 1시간 50분정도 시간이 소요됐습니다.

수 일 전부터 lugia 에서 약 2MB/s정도로 꾸준하게 네트워크 패킷 전송이 있고, hep nfs도 비슷한 양 만큼 전송이 이루어지고 있었음.

또한 hep과 lugia에서 top 을 했을 때 [192.168.X.Y ma] 와 같은 프로세스명이 나타나는 것을 확인함


원인 이해

[192.168.X.Y ma]가 top에서 나타나는 것은 nfs관련한 kernel thread가 나타나는 것임. stack overflow에 kernel bug가 있는 경우 이 thread명이 여러 개 나타나는 경우가 있다는 질문 답변이 있음.

어떤 유저/프로세스가 실제로 지속적으로 nfs를 사용하고 있는지 확인은 어려웠음.

수일간 계속 kekcc에서 데이터를 복사하고 있었지만, lugia를 통하지 않고 바로 hep으로 rsync를 했기 때문에 무관할 것으로 추정함.

해결

hep서버에서 nfs-kernel-server를 재시작함.

service nfs-kernel-server restart