open-source-solution-design / ObservabilityPlatform

ObservabilityPlatform is an observability solution based on PromQL, LogQL, and openstracing, integrating deepflow for enhanced monitoring capabilities.
GNU General Public License v3.0
1 stars 1 forks source link

ObservabilityPlatform

该解决方案使用 ClickHouse、Neo4j、VectorDB、PromQL、LogQL、OpenTracing、Prometheus、Grafana、AlertManager 和 DeepFlow 等开源工具。开源的可观察性平台解决方案通过 GitHub Actions 自动交付创建服务。

架构图

请在此添加图片描述

该解决方案使用以下开源软件:

CICD

流水线配置文件 配置文件位于 .github/workflows/pipeline.yaml 由四个阶段组成:

Playook 角色说明

可观察性平台配置库由以下角色组成:

node-exporter: 部署 node_exporter 来收集系统指标。 prometheus-transfer: 转发 Prometheus 将指标传输到远程存储。 promtail-agent: 部署 Promtail 从节点收集日志。 k3s: 提供管理 k3s 集群的任务。 k3s-addon: 部署 k3s 附加组件。 k3s-reset: 将 k3s 集群重置为初始状态。 secret-manger: 部署 secret-manager 来管理敏感数据。 cert-manager: 部署 cert-manager 以颁发 TLS 证书。 clickhouse: 部署 Clickhouse 以存储和分析时序数据。 observability-agent: 在 k3s 节点上部署可观察性代理。 observability-server: 部署可观察性服务器组件。 mysql: 部署 MySQL 以存储 Deepflow数据以及Grafana配置信息。 alerting: 存储 Prometheus Alertmanager Rules 。

容器集群相关相关的 Ansible playbook roles

非容器集群相关的 Ansible playbook roles

触发器

管道由以下事件触发:

环境变量

在YAML文件或CI/CD流水线配置中定义的ENV变量:

如需在自己的账号运行这个Demo,只需要将 https://github.com/open-source-solution-design/ObservabilityPlatform.git 这个仓库Fork 到你自己的Github账号下,同时在

Settings -> Actions secrets and variables: 添加流水线需要定义的 secrets 变量

Server 相关 secrets 变量

客户端相关 secrets 变量

API Endpoint

name URI
querying(promql, logql, tempo) http://data-gateway.
metrics_query https://prometheus./api/v1/query
metrics_remote_write https://prometheus./api/v1/remote/write
logql_remote_query https://data-gateway./loki/api/v1/query
logql_remote_write https://data-gateway./loki/api/v1/push
traces_tempo_push https://data-gateway./tempo/api/push
traces_zipkin_push https://data-gateway./api/v2/spans
traces_oltp_push https://data-gateway./v1/traces
Query Traces https://data-gateway./api/traces/{traceId}
Query Traces (JSON) https://data-gateway./api/traces/{traceId}/json

Reference

  1. 可观测平台-2: 开源解决方案 https://cloud.tencent.com/developer/article/2363793
  2. 可观测平台-3: 应用系统告警项 https://cloud.tencent.com/developer/article/2370478 可观测平台-3.1: Web前端/后端/网关 监控项: https://cloud.tencent.com/developer/article/2370608 可观测平台-3.2: Cache/MQ/TQ 中间件监控项原创: https://cloud.tencent.com/developer/article/2370613 可观测平台-3.3: 数据库监控项: https://cloud.tencent.com/developer/article/2370615