sic-khu / sichpc

0 stars 0 forks source link

Telegraf 를 이용한 노드 상태 모니터링 #2

Open jhgoh opened 12 months ago

jhgoh commented 12 months ago

Telegraf 와 influxdb를 이용하여 노드 상태를 모니터링 하기.

jhgoh commented 7 months ago

테스트로 설정 완료.

hep 서버에 influxdb 설정

각 노드에 telegraf 설치 (https://docs.influxdata.com/telegraf/v1/install/?t=RedHat+%26amp%3B+CentOS)

jhgoh commented 7 months ago

grafana에서 datasource 설정 뒤 대시보드에 각종 아이템 추가함.

image

jhgoh commented 7 months ago

노드의 이미지에 telegraf 설치하고 이미지 리빌드.

cp /etc/yum.repos.d/influxdb.repo ./etc/yum.repos.d/
dnf -y install telegraf --installroot=/opt/ohpc/admin/images/rocky8/
\cp /etc/telegraf/telegraf.conf ./etc/telegraf/telegraf.conf
wwvnfs rocky8

작업 완료.

jhgoh commented 6 months ago

gpu01 리붓 후 확인 결과 telegraf가 제대로 설치된 상태가 아닌 것으로 보임.