总览

本系列文章将简单介绍一下一个k8s监控项目是怎么做的,把grafana、thanos、prometheus(非operator)、kube-state-metricss/node-exporter/redis-exporter、redis-cluster结合起来(组件有很多种,我们用redis做示范),我们在自己的平台嵌入grafana面板,通过grafana从thanos查询并展示数据,thanos聚合prometheus的数据,prometheus从redis-exporter查询数据(包括redis组件指标(db/key等)以及redis基础指标(cpu/memory等)、redis-exporter导出redis指标。

内容:

1:组件监控平台和grafana   
	1:web服务器,接受请求,生成grafana url,并返回对应的grafana面板给用户;通过thanos查询所有集群名,然后把结果返回给前端(重点)
	2:部署grafana,很简单,可以百度/chatgpt,故一笔带过;配置grafana,普通用户看到部分变量,管理员看到全部变量(重点)
	3:grafana面板配置,包括变量设置,promql编写,仪表盘设置,这里只是简单介绍一下,更多详情请自己百度

备注:我们的组件监控平台是我们自己的网页,grafana是另外部署的,我们的组件平台去grafana请求网址,然后再把获取的页面嵌入到我们自己的监控平台

2:数据源
	1:thanos (略)
		1:指标中标签的问题
		2:thanos query/thanos sidecar/prometheus的启动参数样例
	2:prometheus(暂不包含告警部分)
		1:external配置
		2:抓取目标配置
		3:标签重写、替换等
		4:promql举例
	3:prometheus-operator方式
		1:serviceMonitor crd
		2:prometheusRule crd
		3:prometheus crd

3:exporter(略,有空再写,百度一下都有现成的)
	1:kube-state-metrics:导出k8s集群指标
	2:node-exporter:导出节点、pod的基础指标,如cpu/memory
	3:redis-exporter:把redis指标转换成prometheus格式的指标
	4:redis-cluster:redis集群
Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐