polarismesh / polaris

Service Discovery and Governance Platform for Microservice and Distributed Architecture
https://polarismesh.cn
Other
2.4k stars 397 forks source link

内部项目接入-腾讯云实例健康检查一直超时导致告警不断(应用功能不受影响,但是会有超时告警) #1330

Closed xjiahong closed 5 months ago

xjiahong commented 8 months ago

我接入了腾讯云的北极星组件,但是有一个健康检查接口一直在报超时,以下是我的腾讯云版本 image 以下是我代码里面的版本 image 以下是我告警的情况,导致一直告警 image 接口调用和应用都没有问题,也没有出现过宕机等情况,功能使用不受影响,但是这个健康检查一直出问题

xjiahong commented 8 months ago

随便点开一个链路追踪: image image

希望支持团队可以拉个群支持一下,使用的项目是腾讯内部项目

xjiahong commented 8 months ago

现在用APM屏蔽了健康检查上报来解决的,具体原因未知

chuntaojun commented 7 months ago

这个 grpc 接口北极星没有去实现,建议 apm 看下怎么关闭这个接口的监控上报

xjiahong commented 7 months ago

已经处理了,屏蔽了这个接口的apm上报

---原始邮件--- 发件人: @.> 发送时间: 2024年3月4日(周一) 晚上9:06 收件人: @.>; 抄送: @.**@.>; 主题: Re: [polarismesh/polaris] 内部项目接入-腾讯云实例健康检查一直超时导致告警不断(应用功能不受影响,但是会有超时告警) (Issue #1330)

这个 grpc 接口北极星没有去实现,建议 apm 看下怎么关闭这个接口的监控上报

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

chuntaojun commented 7 months ago

这个原因和北极星没有关系的,北极星并未提供这个接口,北极星 SDK 本身也没有提供 gRPC 的 health.Watch 来检查北极星SDK和北极星服务端之间的健康检查,建议看下 kratos 这里是不是有开启这个 gRPC 的 health 机制

xjiahong commented 7 months ago

好的感谢,我这边排查下kratos的