您当前的位置:首页 > 电脑百科 > 网络技术 > 网络技术

关于监控—从原理说起,其实就这么简单

时间:2020-04-02 13:36:56  来源:  作者:

前言

监控系统,是通过持续信息采集、收敛、分析来发现问题,并对解决问题提供数据依赖的一种科学技术。通过监控技术可以实现对故障进行 “事前预警,事后追踪”。

监控,是运维工作中的重要技术,如果没有监控,运维人员就相当于盲人摸象,发现问题会变得很被动;监控也是整个产品生命周期中最重要的一环,如果没有监控,产品中存在的问题就只能等用户反馈(客诉),严重降低用户体验。

目前,互联网行业的监控技术已经很成熟,业界有很多不错的开源产品可供选择,运维在开展监控工作时,选择一款开源监控系统,是一个省时省力,效率最高的方案。

监控目的

监控的目的是通过采集准确的监控指标、配置合理的告警机制,提前或者尽早发现问题,并做出响应、解决问题,进而保证产品的稳定性,提升用户体验。

具体可分为以下几方面:

  1. 对系统持续实时监控:指硬件系统,如服务器、路由器、交换机等;
  2. 对应用持续实时监控:指业务运行依赖的基础服务,如数据库、中间件等;
  3. 对业务持续实时监控:指产品运行情况,如状态码、接口响应时间、异常信息等。

监控方法

在了监控的重要性及监控目的之后,我们来聊聊到底如何做监控。

关于监控—从原理说起,其实就这么简单

 

  1. 确定监控对象:明确是系统监控,还是应用监控,或者是业务监控;
  2. 确定监控指标:确定监控对象之后,需要明确具体监控指标,如果监控对象为服务器,那么监控指标有CPU、磁盘、内存等;
  3. 确定告警格式:监控的目的之一就是发出告警,所以,告警信息的格式要做到统一、简洁明了;
  4. 确定告警阈值:泛滥的告警就像”狼来了“,所以要设定合理的阈值,确保告警准确、有效;
  5. 确定负责人:确定监控指标后,明确告警负责人,可以让运维或测试人员更快的将事件分发到具体的业务负责人,以提升故障处理效率,同时降低对其他人的打扰;
  6. 确定事件处理流程:对于告警,“事事有回音,件件有着落” 很重要,让每个事件构成一个闭环。

监控指标

监控指标是立足于监控对象至上的,如何确定监控指标?

监控指标,即监控对象相关的关键性指标。

那么,哪些算是关键性指标呢?

这个仁者见仁智者见智,在我看来,对服务稳定运行带来严重影响的才算关键指标。

那么,怎么算严重影响呢?

这个问题可以通过用户体验来反推,哪些问题能带来用户体验的不适?比如,请求响应慢、请求错误、请求报异常等等。

在我看来,站在用户体验的角度来反推监控指标是一个不错的办法。

常规监控指标

以下监控指标仅供参考。

监控对象监控指标硬件CPU温度、主板温度、物理磁盘、磁盘阵列等系统CPU负载、磁盘使用率、内存使用率、网络带宽等应用状态(端口)、进程、应用内部指标(如MySQLredis连接数、内存使用)等业务API、状态码、QPS等日志访问日志、错误日志、运行日志、网络日志等

监控工具

确定监控指标后,遍可以奔着高效、可用的原则来选择监控工具了。

目前业界监控工具很多,常用的开源监控工具:Zabbix、Open-falcon、Prometheus、Grafana(图)等。

关于监控—从原理说起,其实就这么简单

 

相关的文章太多了,在此不做赘述,想要学习推荐官方网站

监控方案

了解了监控指标、监控工具之后,接下来就需要确定一个合理、可行的监控方案了。如何确定监控方案?

  1. 首先,要了解公司的技术栈;
  2. 然后,对涉及到的各种组件进行全面了解;
  3. 其次,确定详细的监控指标,目前各种应用的官网基本都有提供监控相关的metrics;
  4. 最后,选定适应当前需求的监控工具、图形展示、告警方式等等。

总结

监控系统不可能做的尽善尽美,真正想把监控做的尽量完善,依靠开源软件都很难满足。有条件的公司会根据自己的业务需求开发自己的监控系统,如小米的Open-falcon。

原文:https://my.oschina.net/adailinux/blog/3158941



Tags:监控   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
大家好,我是等天黑, 今天介绍一个开源免费的监控工具 Uptime Kuma, 简单实用, 主要用来监控 Web 和网络, 和 Prometheus 不一样的是, 它是轻量的, 基于Node.js 和 Vue 3 开发...【详细内容】
2021-12-16  Tags: 监控  点击:(14)  评论:(0)  加入收藏
在Kubernetes已经成了事实上的容器编排标准之下,微服务的部署变得非常容易。但随着微服务规模的扩大,服务治理带来的挑战也会越来越大。在这样的背景下出现了服务可观测性(obs...【详细内容】
2021-11-02  Tags: 监控  点击:(40)  评论:(0)  加入收藏
最近微信“监控”状态火了,很多用户的微信主页都装上了动态的“摄像头”。 这到底是怎么做到的呢?其实设置方法非常简单,只需要用到一张动态表情图。 然后将表情图长按,并添加...【详细内容】
2021-10-19  Tags: 监控  点击:(1783)  评论:(0)  加入收藏
谈起水表,基本上每一个家里都是有一款水表,用于计量家中的用水量。伴随着我们生活水平的提升,水表的工艺也在不断发展,远程监控水表在日常生活中愈来愈广泛,那么以NB-IOT为例子,告...【详细内容】
2021-10-09  Tags: 监控  点击:(62)  评论:(0)  加入收藏
网络监控摄像头已经进入了我们生活的方方面面,它以安装使用方便及价格低廉,在现代社会得到了极大的普及。在网络摄像机安装过程中,有很多需要注意的问题,下面简要介绍六个问题及...【详细内容】
2021-09-26  Tags: 监控  点击:(82)  评论:(0)  加入收藏
监控系统硬盘怎么选择?常见的有绿盘、蓝盘、紫盘、黑盘、红盘分别代表了什么?有哪些不同呢?今天我们就来聊聊这个话题。在监控安装过程中,录像存储大多都是采用监控硬盘存储的。...【详细内容】
2021-09-22  Tags: 监控  点击:(181)  评论:(0)  加入收藏
MySQL的监控通过日志文件来实现。那么MySQL的日志文件有哪些类型呢? MySQL使用以下这几种类型的日志来记录服务器活动信息。Error log错误日志:关于启动、关闭和异常情况的诊...【详细内容】
2021-09-18  Tags: 监控  点击:(50)  评论:(0)  加入收藏
上篇我们讲解了光纤基础知识,知道了常见的光纤有单模、多模。单模: L ,波长1310 单模长距LH 波长1310,1550多模:SM 波长850 单模光纤与多模光纤的全面易懂的介绍用一句通俗...【详细内容】
2021-09-16  Tags: 监控  点击:(71)  评论:(0)  加入收藏
ntopng是原ntop下一代版本,网络流量实时监控显示。ntopng用户可以使用一个网页浏览器浏览的NTOP(即作为一个Web服务器)流量信息和得到网络状态转储。我采用的是git方式一、安装...【详细内容】
2021-09-07  Tags: 监控  点击:(54)  评论:(0)  加入收藏
Prometheus 是一款基于时序数据库的开源监控告警系统,说起 Prometheus 则不得不提 SoundCloud,这是一个在线音乐分享的平台,类似于做视频分享的 YouTube,由于他们在微服务架构的...【详细内容】
2021-08-26  Tags: 监控  点击:(60)  评论:(0)  加入收藏
▌简易百科推荐
写一个shell获取本机ip地址、网关地址以及dns信息。经常会遇到取本机ip、网关、dns地址,windows一个命令ipconfig /all全部获取到,但linux系统却并非如此。linux系统都自带ifc...【详细内容】
2021-12-27  K佬食古    Tags:shell   点击:(2)  评论:(0)  加入收藏
步骤1、配置 /etc/sysconfig/network-scripts/ifcfg-eth0 里的文件。it动力的CentOS下的ifcfg-eth0的配置详情:[root@localhost ~]# vim /etc/sysconfig/network-scripts/ifc...【详细内容】
2021-12-24  忆梦如风    Tags:网卡   点击:(10)  评论:(0)  加入收藏
1、查找当前目录下所有以.tar结尾的文件然后移动到指定目录find . -name “*.tar” -execmv {}./backup/ ;注解:find –name 主要用于查找某个文件名字,-exec 、xargs可...【详细内容】
2021-12-17  郭主任    Tags:运维   点击:(20)  评论:(0)  加入收藏
对于经常上网的朋友来说,除了手机购物上网,pc端玩网页游戏还是很多小伙伴首选的,但是有时候明明宽带链接上了,打开浏览器却出现上不了网的现象,下面小编要来跟大家说说电脑有网络...【详细内容】
2021-12-16  小白系统    Tags:网页无法打开   点击:(28)  评论:(0)  加入收藏
在访问像github、gitlab这样的外国网站时,很有可能会出现页面加载不出来或找不到页面的错误。这时候有的朋友就会以为是网络的问题,于是把Wifi断掉连上自己手机的热点,结果却还...【详细内容】
2021-12-15  启施技术IT狼叔    Tags:外网   点击:(16)  评论:(0)  加入收藏
网络地址来源:获取公网IP地址 https://ipip.yy.com/get_ip_info.phphttp://pv.sohu.com/cityjson?ie=utf-8http://www.ip168.com/json.do?view=myipaddress...【详细内容】
2021-12-15  韦廷华12    Tags:外网ip   点击:(15)  评论:(0)  加入收藏
准备好软件IPOP、用ENSP模拟一下华为交换机 启动交换机 <Huawei>sysEnter system view, return user view with Ctrl+Z.[Huawei]sysname FTPClient[FTPClient]interface vla...【详细内容】
2021-12-15  思源Edward    Tags:交换机   点击:(24)  评论:(0)  加入收藏
我们经常用到netstat命令查看主机连接状况,包括连接ip、端口、状态等,今天就练习下shell分析netsat结果。描述假设netstat命令运行的结果我们存储在nowcoder.txt里,格式如下:Pro...【详细内容】
2021-12-14  K佬食古    Tags:netstat   点击:(19)  评论:(0)  加入收藏
什么是滑动窗口?窗口是操作系统开辟的一块缓存空间,发送方在收到接收方ACK应答之前,必须在缓冲区保留已发送的数据,如果按期收到确认应答,数据就可以从缓冲区移除。什么是滑动窗...【详细内容】
2021-12-14  DifferentJava    Tags:TCP   点击:(30)  评论:(0)  加入收藏
概述日常管理华为路由设备过程中,难为会忘记设备登录密码,那么该如何重置设备登录密码吗?本期文章将全面向各位小伙伴总结分享。重置华为设备登录密码思路先行 采用console登录...【详细内容】
2021-12-10  onme0    Tags:   点击:(27)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条