
【完整教程】Prometheus+Grafana监控系统搭建
一. 概述
1.1 Grafana介绍
Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知。它主要有以…

基于Go语言的滴滴DevOps重塑之路
研发效率和系统稳定性是研发团队永远无法绕开的话题,前者决定业务迭代效率,而后者决定交付质量。多年来,滴滴在保障稳定性的前提下不断探索更高效的技术手段,积累了大量…

干货 | 故障召回率提升34%,携程智能异常检测实践
作者简介
零一,携程算法工程师,专注于智能告警、容量管理、根因定位等领域。
一、背景
携程作为在线旅游公司,对外提供机票、酒店、火车票、度假等丰富的旅游产品,其…

复杂业务逻辑下的智能告警与故障定位该怎么做?
随着出行业务的发展与行业技术的革新,滴滴在业务上和技术上都在与时俱进,这个过程中呈现了其独有的特点与难点。
在业务上,滴滴既要有严谨的交易逻辑和计算复杂的业务系…

微服务井喷时代,我们如何规模化运维?
随着云原生技术发展及相关技术被越来越多运用到公司生产实践当中,有两种不可逆转的趋势:
1、微服务数量越来越多。原来巨型单体服务不断被拆解成一个个微服务,在方便功…

服务拓扑串联难?eBPF为滴滴可观测带来解题新思路
上篇文章我们讲到可观测性在滴滴的实践与落地,更多关注的是不同观测信号之间的关联关系。那服务与服务之间的关系又如何串联,业界当前爆火的 ebpf 又在滴滴有着怎样…

可观测平台如何存储时序曲线?滴滴实践全历程分享
滴滴的时序曲线量从 2017 年 到 2023 年增长了几十倍。整个过程中我们不断地调整和改进以应对这样的增长。例如时序数据库的选型从最初的 InfluxDB,…

滴滴可观测平台 Metrics 指标实时计算如何实现了又准又省?
在滴滴,可观测平台的 Metrics 数据有一些实时计算的需求,承载这些实时计算需求的是一套又一套的 Flink 任务。之所以会有多套 Flink 任务,是因为…

阿里技术:Khronos: 面向万亿规模时间线的性能监控引擎建设实践
阿里巴巴智能引擎事业部自研的 Khronos 系统是阿里内部接入规模最大的性能数据存储引擎。Khronos 支持动态生命周期的存储计算分离架构,采用 schem…

Linux操作系统安装ELK stack日志管理系统–(2)Elasticsearch与Kibana的安装与使用
前言
Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎。它允许您快速和近实时地存储,搜索和分析大量数据。
Kibana作为日志的过滤web展…

Linux操作系统安装ELK stack日志管理系统–(1)Logstash和Filebeat的安装与使用
安装测试环境:Ubuntu 16.04.2 LTS
前言
(1)ELK是Elasticsearch,Logstash,Kibana 开源软件的集合,对外是作为…