CPM: 每分钟调用次数
Avg Response Time: 平均响应时间

文章插图
从应用整体外部来看我们可以监测到应用在一定时间段内的
- 服务可用性指标SLA
- 每分钟平均响应数
- 平均响应时间
- 服务进程PID
- 服务所在物理机的IP、HostName、Operation System

文章插图
还可以监控到Service运行时的CPU、堆内存、非堆内存使用率、以及GC情况 。这些信息来源于JVM 。注意这里的数据可不是机器本身的数据 。
四、服务告警前文我们提到了通过查看拓扑图以及调用链路可以定位问题,可是运维人员又不可能一直盯着这些数据,那么我们就需要告警能力,在异常达到一定阈值的时候主动的提示我们去查看系统状态 。
在Sywalking 6.x版本中新增了对服务状态的告警能力 。它通过webhook的方式让我们可以自定义我们告警信息的通知方式 。诸如:邮件通知、微信通知、短信通知等 。
Skywalking 服务告警
先来看一下告警的规则配置 。在alarm-settings.xml中可以配置告警规则,告警规则支持自定义 。

文章插图
一份告警配置由以下几部分组成:
- service_resp_time_rule:告警规则名称 ***_rule (规则名称可以自定义但是必须以’_rule’结尾
- indicator-name:指标数据名称: 定义参见http://t.cn/EGhfbmd
- op: 操作符: > , < , = 【当然你可以自己扩展开发其他的操作符】
- threshold:目标值:指标数据的目标数据 如sample中的1000就是服务响应时间,配合上操作符就是大于1000ms的服务响应
- period: 告警检查周期:多久检查一次当前的指标数据是否符合告警规则
- counts: 达到告警阈值的次数
- silence-period:忽略相同告警信息的周期
- message:告警信息
- webhooks:服务告警通知服务地址

文章插图
了解了SW所传送的数据格式我们就可以对告警信息进行接收处理,实现我们需要的告警通知服务啦!
我们将一个服务停掉,并将另外一个服务的某个对外暴露的接口让他休眠一定的时间 。然后调用一定的次数观察服务的状态信息以及告警情况 。

文章插图
总结:本文简单的通过skwaylking的配置来对skywlaking的功能进行一次初步的了解,对skwaylking新提出的概念以及新功能进行简单的诠释,方便大家了解和使用 。通过使用APM工具,可以让我们方便的查看微服务架构中系统瓶颈以及性能问题等 。

文章插图
关于作者:赵瑞栋,普元java工程师,从事Eclipse插件开发,参与普元EOS8 Platform开发,现主要参与EOS8微服务管理平台开发工作 。
关于EAWorld:微服务,DevOps,数据治理,移动架构原创技术分享 。长按二维码关注!
【Skywalking微服务监控分析】
推荐阅读
- 借力电商专业服务商 茶企转型进入快车道
- 吃西餐时,服务生拿来2杯柠檬水?记得不要乱喝,否则会闹出笑话
- 茶行业如何利用全流程服务体系实现品牌突围
- 微软|Windows 11安全新功能来了:密码安全性大大加强
- 信阳浉河区,农技推广 服务助推茶产业发展
- 微笑狗图片吓人原图 微笑狗原图恐怖
- Windows Server 2016如何搭建部署FTP服务器
- Nginx 为什么是高效服务器,架构设计是怎样的?
- ngrok服务器搭建 一分钟实现内网穿透
- 为什么微服务一定要有网关?
