微服务异常之链路跟踪APM工具

时间：2019-10-16 11:00:34 来源：作者：

前言

微服务框架落地后，分布式部署架构带来的问题就会迅速凸显出来。尤其线上出现问题，不知道如何排查，问题出现在哪个服务？如何快速定位问题？如何跟踪业务调用链路？如何分析解决业务瓶颈？今天老顾来跟小伙伴们看看如何解决以上问题。

什么是链路追踪

微服务架构是通过业务来划分服务的，使用REST调用。对外暴露的一个接口，可能需要很多个服务协同才能完成这个接口功能，如果链路上任何一个服务出现问题或者网络超时，都会形成导致接口调用失败。随着业务的不断扩张，服务之间互相调用会越来越复杂。

上图中，user调用A，A会调用C，C再调用E；这条调用链路，我们还能够看清楚；但是一旦微服务很多，调用依赖复杂就看不清楚了，如下图

上图是不是看到后，有密集恐惧症，像个线团，一团乱麻；如果这个时候出现了调用异常，那我们依据调用接口入口，一步步、一个服务一个服务的去跟踪调试；这个流程会把人搞疯的，也许1个小时后，也不知道什么问题；就像我们以前找线头，然后一步步的去重新卷圈。

面对以上情况，我们就需要一些可以帮助理解系统行为、用于分析性能问题的工具，以便发生故障的时候，能够快速定位和解决问题，这就是所谓的 APM（应用性能管理）。

什么是 SkyWalking

Skywalking是一款国内开源的应用性能监控工具，支持对分布式系统的监控、跟踪和诊断。目前主要的一些 APM 工具有: Cat、Zipkin、Pinpoint、SkyWalking。SkyWalking也是Apache的孵化项目之一，拥有顶级二级域名。

它提供了如下的主要功能特性：

功能特性：

多种监控手段，语言探针和服务网格(Service Mesh)
多语言自动探针，JAVA，.NET Core 和 Node.JS
轻量高效，不需要大数据
模块化，UI、存储、集群管理多种机制可选
支持告警
优秀的可视化方案

技术架构

上图看了是不是比较乱，其实Skywalking总体可以分为四部分：

1、Skywalking Agent：使用Javaagent做字节码植入，无侵入式的收集，并通过HTTP或者gRPC方式发送数据到Skywalking Collector。

2、Skywalking Collector ：链路数据收集器，对agent传过来的数据进行整合分析处理并落入相关的数据存储中。

3、Storage：Skywalking的存储，在6.x版本中支持以ElasticSearch（推荐）、MySQL、TiDB、H2、作为存储介质进行数据存储。

4、UI ：Web可视化平台，用来展示落地的数据。

下载并启动 SkyWalking

官方已经为我们准备好了编译过的服务端版本，现在最新版本为6.4.0

下载地址为 http://skywalking.apache.org/downloads/

配置 SkyWalking

下载完成后解压缩

# tar -xvf apache-skywalking-apm-6.4.0.tar
# mv apache-skywalking-apm-bin /usr/local/skywalking
# cd /usr/local/skywalking

修改配置

# cd config

# vim Application.yml@

配置存储方式，默认H2，官方推荐elasticsearch

这里需要做三件事：

注释 H2 存储方案
启用 ElasticSearch 存储方案
修改 ElasticSearch 服务器地址

clusterNodes: ${SW_STORAGE_ES_CLUSTER_NODES:localhost:9200}

启动 SkyWalking

修改完配置后，进入 skywalkingbin 目录，运行startup.bat启动服务端

通过浏览器访问 http://localhost:8080 出现如下界面即表示启动成功

默认的用户名密码为：admin/admin，登录成功后，效果如下图

Java Agent 服务器探针

agent简单的理解就是放一个插件，随着应用程序启动，监控数据、收集数据、发送数据的作用。

探针文件在skywalking/agent目录下

启动方式

在以前启动应用程序时，加上一些参数

java -javaagent:/path/to/skywalking-agent/skywalking-agent.jar 
 -Dskywalking.agent.service_name=shop-goods-provider 
 -Dskywalking.collector.backend_service=localhost:11800 
 -jar yourApp.jar

参数含义：

-javaagent：用于指定探针路径
-Dskywalking.agent.service_name：用于重写 agent/config/agent.config 配置文件中的服务名
-Dskywalking.collector.backend_service：用于重写 agent/config/agent.config 配置文件中的服务地址

启动后，访问链接，就会发现 Service 与 Endpoint 已经成功检测到了

表示 SkyWalking 链路追踪配置成功。

Service Topology监控

调用链路监控可以从两个角度去看待。我们先从整体上来认识一下我们所监控的系统。

通过给服务添加探针并产生实际的调用之后，我们可以通过Skywalking的前端UI查看服务之间的调用关系。

从图中可以看到:

有两个服务节点：provider & consumer

有一个数据库节点：localhost【mysql】

consumer消费了provider提供出来的接口。

一个系统的拓扑图让我们清晰的认识到系统之间的应用的依赖关系以及当前状态下的业务流转流程。

细心的小伙伴们可能发现图示节点consumer上有一部分是红色的，红色是什么意思呢？

红色代表当前流经consumer节点的请求有一断时间内是响应异常的。当节点全部变红的时候证明服务现阶段内就彻底不可用了。运维人员可以通过Topology迅速发现某一个服务潜在的问题，并进行下一步的排查并做到预防。

Skywalking Trace监控

Skywalking通过业务调用监控进行依赖分析，提供给我们了服务之间的服务调用拓扑关系、以及针对每个endpoint的trace记录。

我们在之前看到consumer节点服务中发生了错误，让我们一起来定位下错误是发生在了什么地方又是什么原因呢？

在每一条trace的信息中都可以看到当前请求的时间、GloableId、以及请求被调用的时间。我们分别看一看正确的调用和异常的调用。

Trace调用链路监控

上图展示的是一次正常的响应，这条响应总耗时19ms；可以详细点击每个span查看详细信息

Service JVM信息监控

Skywalking还可以监控到Service运行时的CPU、堆内存、非堆内存使用率、以及GC情况。这些信息来源于JVM。

Skywalking 服务告警

上面我们提到了通过查看拓扑图以及调用链路可以定位问题，可是运维人员又不可能一直盯着这些数据，那么我们就需要告警能力，在异常达到一定阈值的时候主动的提示我们去查看系统状态。

在Sywalking 6.x版本中新增了对服务状态的告警能力。它通过webhook的方式让我们可以自定义我们告警信息的通知方式。诸如:邮件通知、微信通知、短信通知等。

告警的规则配置。在alarm-settings.xml中可以配置告警规则，告警规则支持自定义。

1、service_resp_time_rule：告警规则名称 ***_rule （规则名称可以自定义但是必须以’_rule’结尾

2、indicator-name：指标数据名称：定义参见http://t.cn/EGhfbmd

3、op: 操作符： > , < , = 【当然你可以自己扩展开发其他的操作符】

4、threshold：目标值：指标数据的目标数据如sample中的1000就是服务响应时间，配合上操作符就是大于1000ms的服务响应

5、period: 告警检查周期：多久检查一次当前的指标数据是否符合告警规则

6、counts: 达到告警阈值的次数

7、silence-period：忽略相同告警信息的周期

8、message：告警信息

文件结尾有最后一个webhooks属性：服务告警通知服务地址

webhooks:
# - http://127.0.0.1/notify/
# - http://127.0.0.1/go-wechat/

总结

本文简单了介绍了Skywalking简单的知识，可以通过Skywalking，可以让我们方便的查看微服务架构中系统瓶颈以及性能问题等。小伙伴们可以去尝试操作一下哦，谢谢！！！

---End---

最近老顾上传了微服务网关的分享课程，请大家多多支持

Tags：微服务点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

微服务项目到底如何分模块？

▶ 企业级项目结构封装释义如果你刚毕业，作为Java新手程序员进入一家企业，拿到代码之后，你有什么感觉呢？如果你没有听过多模块、分布式这类的概念，那么多半会傻眼。为什么一个项...【详细内容】

2021-12-20　　Tags: 微服务点击:(9)　　评论:(0)　　加入收藏

传统IT架构转型，从云原生平台到微服务应用构建

前面谈过很多关于数字化转型，云原生，微服务方面的文章。虽然自己一直做大集团的SOA集成平台咨询规划和建设项目，但是当前传统企业数字化转型，国产化和自主可控，云原生，微服务是不...【详细内容】

2021-12-06　　Tags: 微服务点击:(23)　　评论:(0)　　加入收藏

放弃微服务，构建单体应用

微服务看似是完美的解决方案。从理论上来说，微服务提高了开发速度，而且还可以单独扩展应用的某个部分。但实际上，微服务带有一定的隐形成本。我认为，没有亲自动手构建微服务的经历，就无法真正了解其复杂性。...【详细内容】

2021-11-26　　Tags: 微服务点击:(35)　　评论:(0)　　加入收藏

为什么微服务要有独立数据库

实施微服务架构，我们一直在遵循一个实践原则：每个微服务要有自己独立的数据库，避免数据库层面的耦合。这种理所当然感觉好像不需要多加思考，就是应该这样做；图片来源：James Lewi...【详细内容】

2021-10-11　　Tags: 微服务点击:(42)　　评论:(0)　　加入收藏

Nginx 推出 Kubernetes 微服务参考架构

在今年的NGINX Sprint 2.0虚拟大会上，NGINX（来自流行的开源web服务器/负载均衡器和反向代理背后的公司F5），发布了NGINX现代应用参考架构（MARA）。该公司在一篇博客文章中说，这将帮...【详细内容】

2021-09-26　　Tags: 微服务点击:(61)　　评论:(0)　　加入收藏

字节跳动正式开源内部微服务中间件 CloudWeGo

今天，字节跳动正式宣布开源 CloudWeGo。这是一套以 Go 语言为核心、专注于微服务通信与治理的中间件集合，具有高性能、可扩展、高可靠的特点。项目地址：https://github.com/clo...【详细内容】

2021-09-08　　Tags: 微服务点击:(93)　　评论:(0)　　加入收藏

2021 年 10 大微服务框架

1. Spring Boot 与 Spring Cloud Spring Boot 是用于编写微服务的 Java 基础框架。在Spring Cloud 提供了各种构建全栈微服务的功能。构建小型和大型系统都适合。由于控制反...【详细内容】

2021-08-31　　Tags: 微服务点击:(163)　　评论:(0)　　加入收藏

微服务监控 - 高可用 EFK 日志收集

现有问题在 EFK 日志收集篇中，我们讲解了如何利用 EFK 收集 Kubernetes 集群日志。但是，还存在如下问题。 Elasticsearch 以单节点的形式部署，不能满足生产环境的要求 Fluentd...【详细内容】

2021-08-13　　Tags: 微服务点击:(104)　　评论:(0)　　加入收藏

竟然有5种微服务框架可以替代Spring Boot

在 Java 和 Kotlin 中, 除了使用Spring Boot创建微服务外，还有很多其他的替代方案。名称版本发布时间开发商 GitHub ...【详细内容】

2021-08-06　　Tags: 微服务点击:(175)　　评论:(0)　　加入收藏

程序员不得不了解的微服务的现状和未来，建议收藏哦

一、微服务的现状及未来1.服务架构的演变1.1 单体架构&emsp;&emsp;单体架构应该是我们最先接触到的架构实现了，在单体架构中使用经典的三层模型，即表现层，业务逻辑层和数据访问...【详细内容】

2021-07-22　　Tags: 微服务点击:(125)　　评论:(0)　　加入收藏

▌简易百科推荐

架构师才需要知道的知识：如何做容量预估和调优

为了构建高并发、高可用的系统架构，压测、容量预估必不可少，在发现系统瓶颈后，需要有针对性地扩容、优化。结合楼主的经验和知识，本文做一个简单的总结，欢迎探讨。1、QPS保障目标...【详细内容】

2021-12-27　　大数据架构师　　　　Tags:架构　点击:(5)　　评论:(0)　　加入收藏

嵌入式程序架构--你了解多少？

前言单片机开发中，我们往往首先接触裸机系统，然后到RTOS，那么它们的软件架构是什么?这是我们开发人员必须认真考虑的问题。在实际项目中，首先选择软件架构是非常重要的，接下来我...【详细内容】

2021-12-23　　正点原子原子哥　　　　Tags:架构　点击:(7)　　评论:(0)　　加入收藏

我们需要一次怎样的数据架构变革？

现有数据架构难以支撑现代化应用的实现。随着云计算产业的快速崛起，带动着各行各业开始自己的基于云的业务创新和信息架构现代化，云计算的可靠性、灵活性、按需计费的高性价...【详细内容】

2021-12-22　　　　CSDN　　Tags:数据架构　点击:(10)　　评论:(0)　　加入收藏

微服务项目到底如何分模块？

2021-12-20　　蜗牛学苑　　　　Tags:微服务　点击:(9)　　评论:(0)　　加入收藏

开源的springboot+thymeleaf后台架构，程序员用了都点赞

我是一名程序员关注我们吧，我们会多多分享技术和资源。进来的朋友，可以多了解下青锋的产品，已开源多个产品的架构版本。Thymeleaf版（开源）1、采用技术： springboot、layui、Thymel...【详细内容】

2021-12-14　　青锋爱编程　　　　Tags:后台架构　点击:(21)　　评论:(0)　　加入收藏

长链接、短链接与连接池

在了解连接池之前，我们需要对长、短链接建立初步认识。我们都知道，网络通信大部分都是基于TCP/IP协议，数据传输之前，双方通过“三次握手”建立连接，当数据传输完成之后，又通过“四次挥手”释放连接，以下是“三次握手”与“四...【详细内容】

2021-12-14　　架构即人生　　　　Tags:连接池　点击:(17)　　评论:(0)　　加入收藏

分布式系统 Etcd 解析

随着移动互联网技术的快速发展，在新业务、新领域、新场景的驱动下，基于传统大型机的服务部署方式，不仅难以适应快速增长的业务需求，而且持续耗费高昂的成本，从而使得各大生产厂商...【详细内容】

2021-12-08　　架构驿站　　　　Tags:分布式系统　点击:(23)　　评论:(0)　　加入收藏

阿里架构师整理的 Netty 学习笔记之：Java NIO 网络编程

本系列为 Netty 学习笔记，本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架，也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层...【详细内容】

2021-12-07　　大数据架构师　　　　Tags:Netty 　点击:(17)　　评论:(0)　　加入收藏

传统IT架构转型，从云原生平台到微服务应用构建

2021-12-06　　人月聊IT　　　　Tags:架构　点击:(23)　　评论:(0)　　加入收藏

放弃微服务，构建单体应用

2021-11-26　　GreekDataGuy　　CSDN　　Tags:单体应用　点击:(35)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游