您当前的位置:首页 > 电脑百科 > 网络技术 > 网络技术

如何在部署中实施实时监控

时间:2023-11-16 12:27:33  来源:51CTO  作者:

译者 | 陈峻

审核 | 重楼

不可否认,在当今的技术环境中,应用系统已变得越来越繁杂。为了及时获悉各种软件应用的健康和服务状态,我们需要通过关注基本的应用指标,来确保应用的所有组件在部署的整个过程中,按照预期运行。

不过,对于项目团队而言,在部署过程中实施实时的监控,似乎已成为了极难实现的运营“必备品”。对此,Datadog正好一显身手。它是一个业界领先的监控和分析平台,可以提供从前端应用到底层硬件等基础架构的每个部分的可见性。与之配套的是大家较为熟悉的Ansible。这是一款在部署和配置管理方面尤为强大的自动化工具。

在本文中,我将和您讨论Datadog实时监控会被如何集成到基于Ansible的部署中,以及在整体部署过程中,如何通过实时监控以大幅降低事故的发生。当然,其相关概念与方法,也可以被应用到类似的监控和部署工具集中。

为何要在部署中集成实时监控?

在不断迭代与发展的DevOps领域,开发与运营之间的界限正变得越来越模糊,两者直接的协作正变得越来越紧密。正是这种整合,促进了团队成员越来越需要在应用系统的整个生命周期内进行持续监控,而不仅仅是在部署之后才监控。

那么,如果将Datadog与您的现有部署流程、及部署脚本相集成,到底能够带来哪些优势呢?我为您总结了如下三项基本要素:

  1. 即时反馈:在部署过程中实施实时监控的主要好处之一是,它能够创建即时的反馈回路。特别是在滚动部署的过程中,当一台或多台主机部署出现问题时,实时监控数据可以立即被用于做出暂停或启动部署回滚的决策。这种快速回撤往往就决定了是会发生较小的故障,还是大型灾难。尤其是对于某些海量用户级别的应用而言,即使1分钟的停机时间,也可能导致大量的错误和损失。
  2. 资源和性能监控:在部署新功能或变更现有服务时,我们往往会在无形中引入涉及到性能、资源利用率、以及相关成本的风险。而通过实时监控,团队可以立即获悉变更给系统性能和资源利用率造成的影响,进而采取任何必要的即时补救措施,以确保用户继续获得最佳的使用体验。
  3. 主动解决问题:通过将Datadog直接集成到部署流程中,而不是在最终用户受到影响后才对问题做出反应,项目团队可以更主动的方式解决问题,并防止潜在的问题演变成重大故障。这种积极主动的方法,不但可以增加系统的整体正常运行时间,并提高部署发布的稳定性,而且能够保障用户持续的满意度。

在部署中实施实时监控的过程

一旦部署工具被触发,底层的脚本就会开始执行。对此,我们需要根据应用的各项实际需求,预先确定执行监控检查的理想位置,并发送一个或多个Datadog API请求,去查询相关指标、监控过程数据、或其他有助于我们确定部署和整个应用健康状况的信息。

据此,我们需要在脚本中添加逻辑,以便解析来自Datadog的API响应,并做出是否转入下一组部署的适当决策。例如,如果我们发现错误过多、且监控频繁报障的话,那么我们就应该相应地对这些收集到的信息予以解析,以决定是否中止部署,不再继续下去,从而减少潜在的生产事故的影响半径。下图展示了这个典型的工作流程。当然,具体各个阶段可以根据您的应用的实际需求进行调整。

如何在部署中实施实时监控具有集成监控的部署流

利用Datadog及其API接口进行实时查询

除了基础监控功能,Datadog还提供了另一个增强DevOps团队能力的关键优势:其强大的API接口。它不仅是一项功能,更是一种变革性的工具。借助以编程方式查询指标、以及各项跟踪和日志等能力,项目团队可以动态地将Datadog更深入地集成到其运营之中。据此,他们可以进行定制化的监控配置、自动警报设置、以及即时提取相关数据。而且,这种实时查询不仅仅是为了获取数据,更是为了给部署决策提供相关信息,完善应用性能,进而创建一个更具协同性的技术生态环境。通过利用Datadog的API,监控不再是一种被动的观察,而是优化部署工作流程的主动驱动力。

同时,作为一种监控工具,Datadog可以密切关注目标系统的各项技术设置,检查其性能和错误状况。由于能够提供及时的反馈,因此系统一旦出现问题,Datadog就会立即向运营团队发出警报,以协助他们更快地解决问题,保持一切顺利运行。在如下的实施方案中,我们通过获取查询监控器的数据,以判定是否有任何被触发的警报。此外,我们还会查询各项指标和其他类似的数据,以协助确定应用的健康状况。

下图展示便是一个从Datadog的API参考表中,获取特定监视器详细信息的示例。

如何在部署中实施实时监控对Datadog API端点的Curl请求示例

以Ansible自动化部署为例

当我们使用Datadog等工具深入研究复杂的监控时,了解支撑目标应用的部署机制是至关重要的。在此,我们将以Ansible为例。如前所述,它是一款以简单性和强大功能为显著优势的开源自动化工具。

通常,Ansible会使用声明式语言(Declarative Language)来定义系统配置,使其既易于人类阅读,又能够直接与各种平台和工具相集成。在部署方面,Ansible可以确保一致性和可重复的应用部署,从而降低与手动流程相关的各类风险。如果与Datadog等实时监控解决方案配合使用,Ansible不仅可以自动化部署应用,而且能够确保它们在部署之后以最佳的状态运行。可以说,这种自动化部署与实时监控之间的协同,构建出了一个强大的、反应灵敏的、容错性高的部署生态系统。

下图的代码片段展示了在Ansible中,Datadog监控器如何实现以“deployment_priority: blocker”为标签,进行查询的示例。

如何在部署中实施实时监控在Ansible中实现的监控查询

在此基础上,我们需要解析从Datadog返回的所有此类监控的状态,以决定是终止监控,还是继续到下一台主机或下一组部署。

如何在部署中实施实时监控迭代监视器的解析和决策的制定

至此,我们已完成了在部署过程中实施实时监控,并具备了对Datadog的监控信息予以解析,进而在部署过程中及时做出明智的决策的能力。

小结

在上文的探讨中,我们既利用了强大的部署工具Ansible所提供的一致、可靠的部署的能力;又结合了Datadog等平台的细粒度实时监控能力,提高了项目部署的运营效率和可靠性。随着技术领域的不断发展,Ansible和Datadog等工具充分证明了集成式智能DevOps的实践潜力。

无论您是经验丰富的DevOps专业人士,还是刚刚涉足本领域的“小白”,了解并利用这种协同,都将有利于打造一个面向未来、具有高自愈能力的技术生态系统。

译者介绍

陈峻(Julian Chen),51CTO社区编辑,具有十多年的IT项目实施经验,善于对内外部资源与风险实施管控,专注传播网络与信息安全知识与经验。

原文标题:Implementing Real-Time Datadog Monitoring in Deployments,作者:Prithvish Kovelamudi



Tags:监控   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
对于微服务架构监控应该遵守的原则
随着软件交付方式的变革,微服务架构的兴起使得软件开发变得更加快速和灵活。在这种情况下,监控系统成为了微服务控制系统的核心组成部分。随着软件的复杂性不断增加,了解系统的...【详细内容】
2024-04-03  Search: 监控  点击:(4)  评论:(0)  加入收藏
男子参加公司年会酒后身亡,被判自担主责,监控显示其向他人敬酒26次
年终岁尾,很多公司会举行聚餐等团体活动。2023年1月,男子杨某在四川攀枝花市参加公司年会,在聚会中大量饮酒,后身体出现不适,送医抢救无效死亡。后经司法鉴定,认定杨某死亡原因为...【详细内容】
2024-03-25  Search: 监控  点击:(13)  评论:(0)  加入收藏
Windows任务管理器将更新 为锐龙8040系列增加NPU监控
AMD官方现已确认正与微软合作,为锐龙8040系列APU的NPU上启用MCDM,从而使Windows 11的任务管理器支持AMD NPU的占用显示。AMD此前已经发布了新的锐龙8040系列移动处理器,进一步...【详细内容】
2024-02-23  Search: 监控  点击:(15)  评论:(0)  加入收藏
Java生产环境下性能监控与调优详解
堆是 JVM 内存中最大的一块内存空间,该内存被所有线程共享,几乎所有对象和数组都被分配到了堆内存中。堆被划分为新生代和老年代,新生代又被进一步划分为 Eden 和 Survivor 区,...【详细内容】
2024-02-04  Search: 监控  点击:(55)  评论:(0)  加入收藏
一文聊聊如何快速监控 Oracle 数据库
Cprobe 是一个探针采集器,支持常见数据库、中间件的采集,比如 MySQL、Redis、MongoDB、Oracle、Kafka、ElasticSearch 等。安装配置 Oracle简单起见,我使用 Docker 启动 Oracl...【详细内容】
2023-12-26  Search: 监控  点击:(125)  评论:(0)  加入收藏
Redis Sentinel的监控和自动化处理Redis节点故障恢复机制
Redis Sentinel是一个分布式的监控系统,它可以监控多个Redis节点的健康状态,并在节点发生故障时自动进行故障转移和恢复。Redis Sentinel通过选举机制选择一个主节点,并将其他...【详细内容】
2023-12-25  Search: 监控  点击:(81)  评论:(0)  加入收藏
监控 Spring Cloud 微服务的实践方案
一、简介Spring Cloud是一个基于Spring Boot实现的微服务框架,它提供了丰富的微服务功能,如分布式配置、服务注册与发现、服务熔断、负载均衡等。为了更好地管理和监控这样复...【详细内容】
2023-12-19  Search: 监控  点击:(141)  评论:(0)  加入收藏
Oracle数据库性能监控:洞察系统瓶颈的利器!
在当今信息时代,企业对于数据的存储和管理变得越来越重要。Oracle数据库作为全球广泛应用的关系型数据库管理系统,承载着大量的业务数据和应用。为了确保数据库的高效稳定运行...【详细内容】
2023-12-18  Search: 监控  点击:(87)  评论:(0)  加入收藏
使用Java构建云原生监控与日志系统
随着云计算的兴起,云原生架构的应用越来越广泛。在云原生架构中,监控和日志系统是至关重要的组成部分,它们帮助开发人员实时监测和分析系统的性能和运行状态。下面将介绍如何使...【详细内容】
2023-11-17  Search: 监控  点击:(225)  评论:(0)  加入收藏
14个开源免费数据库监控工具,MySQL、Oracle、Postgres或MSSQL
在信息系统项目中,UI、业务逻辑、数据库操作、文件操作、网络、API调用等许多环节都有可能产生性能问题,其中,数据库读写是最为常见的操作,我们也发现其实许多项目中的大部分瓶...【详细内容】
2023-11-17  Search: 监控  点击:(272)  评论:(0)  加入收藏
▌简易百科推荐
手机就可以修改WiFi密码,进行网络提速,还能防止别人蹭网
随着网络的普及和使用频率的增加,很多人可能遇到了一些网络管理上的问题,比如忘记了WiFi密码、网络速度缓慢、或者发现有不明设备在家中蹭网。相信朋友们也曾遇到过吧?但是,你知...【详细内容】
2024-04-03  老毛桃    Tags:WiFi密码   点击:(5)  评论:(0)  加入收藏
手机WiFi信号满格却接收消息延迟?这里有妙招帮你解决!
在现代社会,手机已经成为了我们生活中不可或缺的一部分。无论是工作、学习还是娱乐,手机都扮演着重要的角色。然而,有时我们会遇到一些令人烦恼的问题,比如明明手机WiFi信号满格...【详细内容】
2024-04-03  蔡前进    Tags:手机WiFi   点击:(4)  评论:(0)  加入收藏
SASE技术应用落地的五个关键趋势
在Gartner 最新发布的《2023网络技术成熟度曲线》报告中认为,SASE技术已经开始走出最初的技术炒作期,将逐步迈向新一轮的实用落地阶段。在Gartner发布的《Hype Cycle for Ente...【详细内容】
2024-04-01    安全牛  Tags:SASE   点击:(9)  评论:(0)  加入收藏
提示“该网站安全证书存在问题,连接可能不安全”如何解决
在你输入网址并浏览网页时,如果你的浏览器弹出一个警告,提示“网站的安全证书存在问题”,或是显示一个红色的锁标志,这些都是网站不安全的警示。这些提示通常是由HTTPS协议中的S...【详细内容】
2024-03-18  倏然间    Tags:网站安全证书   点击:(8)  评论:(0)  加入收藏
如何有效排除CAN总线错误
控制器局域网(CAN)控制器局域网(CAN)是现代车辆中电子元件无缝运行的基础。在远程信息处理领域,CAN总线系统的效率至关重要,其能够实现支撑当今汽车技术的复杂功能。然而,CAN总...【详细内容】
2024-02-20    千家网  Tags:CAN   点击:(46)  评论:(0)  加入收藏
网络连接受限或无连接怎么办?这里提供几个修复办法
可能错误提示 连接受限或无连接:连接具有有限的连接或无连接。你可能无法访问Internet或某些网络资源。 连接受限。排除和解决“连接受限或无连接”错误此错误可能由计算机上...【详细内容】
2024-02-06  驾驭信息纵横科技    Tags:网络连接受限   点击:(43)  评论:(0)  加入收藏
如何将Mac连接到以太网?这里有详细步骤
在Wi-Fi成为最流行、最简单的互联网连接方式之前,每台Mac和电脑都使用以太网电缆连接。这是Mac可用端口的标准功能。如何将Mac连接到以太网如果你的Mac有以太网端口,则需要以...【详细内容】
2024-02-03  驾驭信息纵横科技    Tags:Mac   点击:(66)  评论:(0)  加入收藏
简易百科之什么是端口映射
端口映射,也称为端口转发,是一种网络通信中的技术手段,通过将内网中的一个端口上的数据流量转发到另一个端口,使得外部网络能够访问到内部网络中的特定服务。在实现上,端口映射通...【详细内容】
2024-01-26    简易百科  Tags:端口映射   点击:(153)  评论:(0)  加入收藏
ip因频繁登陆已被禁止访问 无法显示图片 怎么办
首先,我们要明白,部分网站为了有效遏制数据爬取和非法攻击,保证访问速度和普通用户查询,会在系统中增加网络安全设备,加强安全防护机制,并提前设置安全访问规则。因此,一旦用户的行...【详细内容】
2024-01-20  何福意思    Tags:ip   点击:(63)  评论:(0)  加入收藏
电脑连上wifi却上不了网怎么办
当电脑连接上 WiFi 却无法上网时,可能会让人感到困惑和沮丧。这个问题通常会有多种可能的原因,包括网络配置问题、路由器故障、无线适配器问题等。在面对这个问题时,可以尝试以...【详细内容】
2024-01-16  编程资料站    Tags:wifi   点击:(68)  评论:(0)  加入收藏
站内最新
站内热门
站内头条