跳转到主要内容
Chinese, Simplified

category

【记录、跟踪和度量是系统可观测性AIOps的三大支柱】
记录、跟踪和度量是系统可观测性的三大支柱。

下图显示了它们的定义和典型架构。

🔹Logging

日志记录系统中的离散事件。例如,我们可以将传入的请求或对数据库的访问记录为事件。它的音量最大。ELK(Elastic Logstash Kibana)堆栈通常用于构建日志分析平台。我们经常为不同的团队定义一个标准化的日志记录格式来实现,这样我们就可以在大量日志中搜索时利用关键字。
🔹 Tracing

跟踪通常是请求范围的。例如,用户请求通过API网关、负载均衡器、服务a、服务B和数据库,这些都可以在跟踪系统中可视化。当我们试图识别系统中的瓶颈时,这很有用。我们使用OpenTelemetry来展示典型的体系结构,它将三个支柱统一在一个框架中。
🔹  Metrics

度量通常是来自系统的可聚合信息。例如,服务QPS、API响应性、服务延迟等。原始数据记录在InfluxDB等时间序列数据库中。普罗米修斯提取数据并根据预定义的警报规则转换数据。然后,数据被发送到Grafana进行显示,或发送到警报管理器,然后由其发送电子邮件、短信或Slack通知或警报。

交给您:您使用了哪些工具进行系统监控?

原文地址
https://twitter.com/i/status/1768882834654310545
本文地址
Tags
 
Article

微信

知识星球

微信公众号

视频号