复杂业务逻辑下的智能告警与故障定位该怎么做?

随着出行业务的发展与行业技术的革新,滴滴在业务上和技术上都在与时俱进,这个过程中呈现了其独有的特点与难点。
在业务上,滴滴既要有严谨的交易逻辑和计算复杂的业务系…

浅谈弹性计算管控可观测性体系建设

阿里妹导读
为什么需要可观测性?可观测性技术对业务团队的价值有哪些?如何建设一个可观测性技术体系?本文将从整体架构到核心设计一一为大家讲解。
前言
为什么需要…

被报警大量骚扰?来看看治理方法论

阿里妹导读
本文记录了作者组内监控治理过程和治理心得。
一、监控降噪背景
五月六月以来,蚂蚁开启监控治理主题,推进监控进一步完善,做到既能即时响应告警——五分…

超大规模数据库集群保稳系列之二:数据库攻防演练建设实践

本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第2篇文章。
本文首先介绍了…

为什么一定要用消息中间件?

来源:石杉的架构笔记(ID:shishan100)
这篇文章开始,我们把消息中间件这块高频的面试题给大家说一下,也会涵盖一些MQ中间件常见的技术问题。
假如面试…

一位 70 后程序员的 26 个职场感悟

作者:阿里巴巴中间件
微信公众号:阿里巴巴中间件(ID:Aliware_2018)
© -PinkCuty
在上周末阿里巴巴中间件举办的APM深度交流技术沙龙…

关于Java健壮性的一些思考与实践!

来源公众号:一名叫大蕉的程序员 | 作者:大蕉
程序健壮性非常重要,要怎么玩怎么写才能让程序更加鲁棒呢?我又这么几点小建议。
一、进行统一的业务处理响应
根据…

缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等问题!

前面一节说到了《为什么说Redis是单线程的?》,今天给大家整理一篇关于Redis经常被问到的问题:缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等概念的入…

ElastAlert 基于Elasticsearch的监控告警

Elastalert是Yelp公司用python2写的一个报警框架(目前支持python2.6和2.7,不支持3.x).
GitHub地址为 https://g…

elastalert微信报警

针对国人微信使用率较高的情况,开发了三个ElastAlert微信插件(shell,python,java)
简介
ElastAlert支持以下方式报警

Com…