您当前的位置:首页 > 电脑百科 > 网络技术 > 网络技术

后SRE时代监控系统选型

时间:2020-08-10 16:00:16  来源:  作者:

在DevOps和SRE流行的今天,在开发可靠性或实施DevOps实践时,企业决策的核心是统计数据。而企业数据信息中最重要的一环就是线上业务的监控信息,如果没有业务运行时间,网络负载和资源使用情况等关键性监控指标,企业将无法有效的开发或操作实践。而这些数据都有依靠各种各样的监控工具来收集和汇集。

当基于对客户影响的度量标准时,SLO之类的SRE实践最有用。确定监控什么以及如何进行监控是一个重要的决策。本文我们就来了解SRE时代下的监控和流行监控工具。

监控分类

确定在系统体系结构中监控点的分布非常重要。根据监控实施的位置,监控工具将能够获取不同类型的数据。监控最常见分类及监控点分布如下:

资源监控

资源监控也称为服务器监控或基础结构监控,它通过收集有关服务器运行方式的数据来获取基本信息。资源监控工具会监控最基本的主机内存使用率,CPU负载和磁盘空间等信息。在基于物理服务器的体系结构中,有关硬件运行状况的信息(比如CPU温度和组件正常运行时间)也有助于避免服务器故障。在基于云的环境中,虚拟服务器系统的汇聚信息更为有用。

网络监控

网络监控用来监控下行和上行主机的网络数据。监控工具可捕获所有组件(如交换机,防火墙,服务器等)中的所有请求和响应数据包。网络监控可以简单只收集入口和出口总流量,也可以针对更详细的应用或者端口为基准来收集。

App性能监控

APP性能监控用来收集有关整体服务执行情况的数据。这些工具会将自己的请求发送到服务接口,并跟踪指标,例如响应的速度和完整性。目标是推动对APP性能问题的检测和诊断,以确保接口以预期的水平运行。

第三方组件监控

这涉及监控体系结构中第三方组件的运行状况和可用性。在微服务盛行的时代,服务可能取决于外部服务的正常运行。像APP性能监控一样,工具可以根据自己的请求检查这些服务的状态。

在整体解决方案中包括每种监控类型。优先考虑使用健壮的冗余监控工具,以确保不会遗漏潜在问题。同时,指标和警报应与服务绑定在一起,以确保与业务影响相关。

监控指标

拥有可操作的数据不仅与数据本身有关;为了正确响应监控工具报告的内容,还需要以最有用的方式显示数据。以下是监控工具可以提供的事项:

告警:当指标超过特定阈值时触发告警;

事件日志:创建事件日志,根据参数突出显示;

趋势图:创建一段时间内的指标趋势图;

仪表板:一目了然地提供关键服务运行状况组件的仪表板;

指标数据库:创建可以查询的指标数据库。

在制定开发决策或对事件做出响应时,需要了解自己需要什么?需要什么监控指标?这些指标怎么可视化等。

监控工具推荐

下面我们推荐最受欢迎的SRE和DevOps监控工具,可供大家选择。

Prometheus

后SRE时代监控系统选型

 

Prometheus是一种流行的开源监控工具,提供警报,查询,可视化和许多其他有用的功能。Prometheus有专门的开发社区提供了大量文档和说明,可以帮助我们快速入门。虫虫之前的文章也专门介绍过Prometheu,大家可以查看历史文章进行了解。

Zabbix

后SRE时代监控系统选型

 

Zabbix 是最流行的开源分布式企业监控系统。zabbix自带各种模版可以监控各种服务器监控项、网络设备。zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视和数据收集。zabbix是目前使用最广泛最流行的传统以物理服务器为架构的业务系统监控。

zabbix目前在SRE时代问题数据依赖于中心关系数据库(MySQL或者PostgreSQL),监控数据量不能自动清理,累积过大会拖慢系统运行速度。而且对云架构体系监控支持还不够。

Grafana

Grafana是使用golang开发的开源的度量分析与监控可视化仪表盘系统。

后SRE时代监控系统选型

 

Grafana支持时间序列数据和应用程序分析的可视化以仪表盘形式展示当前系统状态。Grafana常见监控系统数据源,也支持对日志汇聚数据源,支持对数据进行筛选,也可以对多个数据源组合显示为一个仪表盘。

NagIOS

Nagios提供了开源(Nagios Core)和商业化定制版本(Nagios XI)。Nagios提供了高度可定制的界面,并可以监控整个IT网络。支持通过配置向导来突出其易用性,以引导用户设置新的监控服务。

后SRE时代监控系统选型

 

AppDynamics

后SRE时代监控系统选型

 

AppDynamics是专注于APM的监控平台。除了传统的APM监控外,提供的其他功能包括基于AI的视角,用于人工智能模拟客户和最终用户监控,以及集成收益分析的业务监控。自从2017年AppDynamics被思科收购以后除了基本APM外,在基础网络设置方面进行的监控

DataDog

后SRE时代监控系统选型

 

DataDog是一个针对云规模服务的监控平台。它在可视化,警报以及数据汇聚和分析方面具有强大的功能。它们使性能指标与业务影响相关联。

听云云平台

听云云平台是国内权威的APM平台之一,通过针对全平台的应用性能监控。听云平台,由听云App、听云Network、听云Server、听云Browser和听云Sys组成,提供针对手机应用、网络、浏览器、服务器的性能监控产品,可以实现应用性能全方位可视化,包括PC端、浏览器、移动客户端到服务器。

New Relic

后SRE时代监控系统选型

 

New Relic是一个监控平台,提供了几个也可以独立使用的组件:New Relic APM(应用程序性能监控),New Relic Browser和New Relic Infrastructure。New Relic提供了适用于iOS和Android的应用程序,为移动应用提供了更多监控选项。

Site24x7

后SRE时代监控系统选型

 

Site24x7专门从事网站监控,提供诸如状态页和Web服务(例如AWS和Azure)运行状况诊断的工具。它们还提供综合Web事务监控,使可以模拟使用情况并收集指标。

SignalFx

后SRE时代监控系统选型

 

SignalFx提供了广泛的微服务集成,可以看到服务运行状况的完整结构,帮助用户从单一模型到微服务模型构建架构。SignalFX可以通过多种方式收集所需的指标,包括收集的,自定义指标或使用第三方应用程序。对于自定义指标类型的用户,则可以直接通过Ruby,PythonJAVA或Node.js从应用程序发送数据。 使用第三方应用程序则可以选择使用现有工具之一,例如AWS cloudwatch,Docker,Elasticsearch,MySQL甚至New Relic。

PRTG Network Monitor

后SRE时代监控系统选型

 

PRTG Network Monitor是一体式完整网络运营监控系统,可以集成到体系结构的许多阶段和位置,可以在网络,单个服务器,特定应用程序以及两者之间的所有内容上提供监控。功能包括:停机监测,阻塞和使用监测,数据包嗅探,深入分析和简明的报告。PRTG Network Monitor有一个基于Web的用户友好的界面,允许用户快速配置网络设备和传感器。



Tags:监控系统   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
监控系统硬盘怎么选择?常见的有绿盘、蓝盘、紫盘、黑盘、红盘分别代表了什么?有哪些不同呢?今天我们就来聊聊这个话题。在监控安装过程中,录像存储大多都是采用监控硬盘存储的。...【详细内容】
2021-09-22  Tags: 监控系统  点击:(180)  评论:(0)  加入收藏
Prometheus 是一款基于时序数据库的开源监控告警系统,说起 Prometheus 则不得不提 SoundCloud,这是一个在线音乐分享的平台,类似于做视频分享的 YouTube,由于他们在微服务架构的...【详细内容】
2021-08-26  Tags: 监控系统  点击:(59)  评论:(0)  加入收藏
一、手机APP远程监控PLC的意义: 随着网络技术和智能手机快速发展,远程通过手机APP对设备系统的控制单元PLC的运行进行远程预警监控的技术已经非常成熟。基于手机APP的PLC远程...【详细内容】
2021-08-25  Tags: 监控系统  点击:(116)  评论:(0)  加入收藏
监控系统在这里特指对数据中心的监控,主要针对数据中心内的硬件和软件进行监控和告警。企业的 IT 架构逐步从传统的物理服务器,迁移到以虚拟机为主导的 IaaS 云。无论基础架构...【详细内容】
2021-07-12  Tags: 监控系统  点击:(183)  评论:(0)  加入收藏
前言在GitHub上发现一个好玩的项目,不用安装其它任何依赖包,只要运行一个Python脚本就可以在局域网构建一个视频监控系统。果断试了一下,确实挺好玩的,现在分享给大家。 搭建方...【详细内容】
2021-03-16  Tags: 监控系统  点击:(172)  评论:(0)  加入收藏
WGCLOUD-v3.3.0更新说明,2021-01-261.新增,进程管理新增流量(读取/写入)指标2.新增,主机所有网卡流量(接收/发送)指标3.新增,数据源连接恢复后,发送恢复通知4.新增,win监控主机支...【详细内容】
2021-01-28  Tags: 监控系统  点击:(187)  评论:(0)  加入收藏
一、LibreNMS简单介绍LibreNMS是一款开源的,功能强大且功能丰富的自动发现的网络监控系统,基于PHP,使用SNMP协议。它支持广泛的操作系统,包括Linux,FreeBSD以及思科,Juniper,Broca...【详细内容】
2021-01-12  Tags: 监控系统  点击:(389)  评论:(0)  加入收藏
前言:大家好,我是薛哥。最近有很多读者咨询我,关于监控系统中IP地址如何选择?如何分配的问题,今天给一些刚入行的新人来讲解一些这方面的问题,分为三种情况,分包为小型的监控系统、...【详细内容】
2020-10-28  Tags: 监控系统  点击:(122)  评论:(0)  加入收藏
web项目性能很重要,开发迭代过程中难免会有所忽视,性能会伴随产品的迭代而有所衰减。特别在移动端,网络一直是一个很大的瓶颈,而页面却越来越大,功能越来越复杂。并没有简单的几...【详细内容】
2020-08-26  Tags: 监控系统  点击:(691)  评论:(0)  加入收藏
在DevOps和SRE流行的今天,在开发可靠性或实施DevOps实践时,企业决策的核心是统计数据。而企业数据信息中最重要的一环就是线上业务的监控信息,如果没有业务运行时间,网络负载和...【详细内容】
2020-08-10  Tags: 监控系统  点击:(54)  评论:(0)  加入收藏
▌简易百科推荐
写一个shell获取本机ip地址、网关地址以及dns信息。经常会遇到取本机ip、网关、dns地址,windows一个命令ipconfig /all全部获取到,但linux系统却并非如此。linux系统都自带ifc...【详细内容】
2021-12-27  K佬食古    Tags:shell   点击:(1)  评论:(0)  加入收藏
步骤1、配置 /etc/sysconfig/network-scripts/ifcfg-eth0 里的文件。it动力的CentOS下的ifcfg-eth0的配置详情:[root@localhost ~]# vim /etc/sysconfig/network-scripts/ifc...【详细内容】
2021-12-24  忆梦如风    Tags:网卡   点击:(9)  评论:(0)  加入收藏
1、查找当前目录下所有以.tar结尾的文件然后移动到指定目录find . -name “*.tar” -execmv {}./backup/ ;注解:find –name 主要用于查找某个文件名字,-exec 、xargs可...【详细内容】
2021-12-17  郭主任    Tags:运维   点击:(19)  评论:(0)  加入收藏
对于经常上网的朋友来说,除了手机购物上网,pc端玩网页游戏还是很多小伙伴首选的,但是有时候明明宽带链接上了,打开浏览器却出现上不了网的现象,下面小编要来跟大家说说电脑有网络...【详细内容】
2021-12-16  小白系统    Tags:网页无法打开   点击:(28)  评论:(0)  加入收藏
在访问像github、gitlab这样的外国网站时,很有可能会出现页面加载不出来或找不到页面的错误。这时候有的朋友就会以为是网络的问题,于是把Wifi断掉连上自己手机的热点,结果却还...【详细内容】
2021-12-15  启施技术IT狼叔    Tags:外网   点击:(14)  评论:(0)  加入收藏
网络地址来源:获取公网IP地址 https://ipip.yy.com/get_ip_info.phphttp://pv.sohu.com/cityjson?ie=utf-8http://www.ip168.com/json.do?view=myipaddress...【详细内容】
2021-12-15  韦廷华12    Tags:外网ip   点击:(14)  评论:(0)  加入收藏
准备好软件IPOP、用ENSP模拟一下华为交换机 启动交换机 <Huawei>sysEnter system view, return user view with Ctrl+Z.[Huawei]sysname FTPClient[FTPClient]interface vla...【详细内容】
2021-12-15  思源Edward    Tags:交换机   点击:(22)  评论:(0)  加入收藏
我们经常用到netstat命令查看主机连接状况,包括连接ip、端口、状态等,今天就练习下shell分析netsat结果。描述假设netstat命令运行的结果我们存储在nowcoder.txt里,格式如下:Pro...【详细内容】
2021-12-14  K佬食古    Tags:netstat   点击:(19)  评论:(0)  加入收藏
什么是滑动窗口?窗口是操作系统开辟的一块缓存空间,发送方在收到接收方ACK应答之前,必须在缓冲区保留已发送的数据,如果按期收到确认应答,数据就可以从缓冲区移除。什么是滑动窗...【详细内容】
2021-12-14  DifferentJava    Tags:TCP   点击:(28)  评论:(0)  加入收藏
概述日常管理华为路由设备过程中,难为会忘记设备登录密码,那么该如何重置设备登录密码吗?本期文章将全面向各位小伙伴总结分享。重置华为设备登录密码思路先行 采用console登录...【详细内容】
2021-12-10  onme0    Tags:   点击:(27)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条