Open hyeon-inno opened 3 months ago
@hyeon-inno (@powerkimhub )
특정 메트릭 추가에 대한 의견은 아니고, 관련하여 전반적인 질문이 있습니다.
Telegraf 가 제공하는 메트릭은 전체 수용도 가능할 것으로 보시나요? 아니면 이슈에 작성해주신 내용처럼 특정 메트릭을 선별해서 지정해야 하는 상황인지요?
Telegraf 가 제공하지 않는 메트릭도 지원도 고려하고 계신 상황인지요? (https://github.com/influxdata/telegraf/tree/release-1.26/plugins/inputs 중에 포함되지 않은 항목 및 메트릭 지원도 고려하고 계신지)
@BSjaeyoung-kim 필요하신 메트릭 협의 부탁드립니다.
@seokho-son 확인이 늦었습니다.
telegraf가 제공하는 가능한 많은 메트릭을 수용하려고 하나 Observability의 안정성을 보장하는것을 우선으로 진행중에 있습니다. 개발 완성도가 어느정도 궤도에 올라왔다고 판단되는 시점에 지원가능 메트릭을 확산해 나가려고 합니다.
현재 별도로 논의된적은 없던 사항이긴 합니다.
@BSjaeyoung-kim 필요하신 메트릭 협의 부탁드립니다.
안녕하세요 현재 작성해주신 링크 확인하면서 메트릭 정보 확인중입니다. 내용 확인후 금주까지는 필요 메트릭에 대해 협의가 가능하도록 명시하도록 하겠습니다.
감사합니다.
@hyeon-inno @seokho-son
안녕하세요 cost opti에서 필요한 메트릭 정보에 대해 공유드립니다. 현 메트릭은 AWS 기준입니다. 개발자 기준으로 자료의 산출이 가능한 서비스로 나누어 작성하였습니다.
cloudwatch EC2에 연결되어있는 EBS정보 EC2에 연결되어있는 EIP 정보 EC2에 연결되어있는 ELB 정보
agent(EC2) ** 30일간에 대한 데이터가 필요합니다. 평균 CPU 사용률 최대 CPU 사용률 평균 memory 사용률 최대 memory사용률 평균 Network I/O 사용량, I/O 발생일수
agenct(RDS) ** 30일간에 대한 데이터가 필요합니다. 평균 Read/Write IOPS DB Connection 평균 CPU사용률 최대 CPU사용률
위 내용은, 현재 저희가 최적화 로직 구현을 위하여 필요한 메트릭정보에 대해 기술한 내용입니다. 해당 메트릭에 대해서 수집이 어렵거나, 구현이 어려운 부분은 공유 부탁드리겠습니다(다른 방안이 있나 확인이 필요합니다) 예를 들어 cloudwatch의 경우 일전의 워크샵에서, cloudwatch에서 정보를 수집할 수 있다는 장표를 보고 작성한 내용이며, 이에 대해서 혹시 위와 같은 메트릭 수집이 가능한지에 대한 여부를 확인차 기술하였습니다.
논의사항 있다면 언제든 연락 바랍니다. 감사합니다.
기본적인 자원의 사용량을 위한 metric에 대해 기재해두었습니다. measurement에 따라 추가로 필요하신 항목이 있으시면 수집여부 확인 후 추가하도록 하겠습니다.