您当前的位置:首页 > 电脑百科 > 数据库 > 百科

数据可观察性ROI:构建引人注目的商业案例的五个关键领域

时间:2023-11-27 14:21:52  来源:51CTO  作者:

译者 | 晶颜

审校 | 重楼

数据可观察性是一种变革性的解决方案,它使组织能够通过实时识别、故障排除和解决数据问题来充分利用其数据的潜力。然而,量化这种新技术的投资回报率(ROI)可能极具挑战性。

数据可观察性ROI:构建引人注目的商业案例的五个关键领域

然而,以下五个关键领域可以将数据可观察性的投资回报率集成到一个引人注目的业务案例中,使您能够衡量切实的收益并做出令人信服的投资案例。

1. 降低本土解决方案的成本

数据工程团队经常投入大量时间开发、维护和验证数据质量规则。数据管道的复杂性以及对来自多个源的验证需求使该过程进一步复杂化,特别是在数据结构不一致的情况下。本土解决方案(Homegrown solutions)缺乏机器学习能力,难以进行异常检测。

衡量影响:要计算ROI,请考虑以下成本驱动因素:

  • 负责开发和维护的工程师人数。
  • 每名工程师每年的全职等量(FTE)成本。

必须认识到,构建数据可观察性系统,就像操作任何软件一样,需要工程(在本例中是数据工程)资源、用于建模和构建异常检测的数据科学专业知识、专门的质量保证团队和负责部署解决方案并确保其无缝运行的DevOps工程师。

尽管这些专业角色的工资范围可能会有所不同,但为了简化,我们可以计算所有团队成员的平均值。

公式:ROI =(负责开发的工程师总数+负责维护的工程师总数)* FTE ($)

2. 减少间接基础设施成本

通过查询验证数据库或数据仓库中的数据(这是许多团队的常见做法)可能会显著增加成本,特别是当这些系统根据使用情况收费时。这包括与查询数量增加、历史数据质量指标存储以及云管理和托管相关的成本。由于这些成本考虑,许多组织选择只验证和监视样本,导致数据质量改进有限,结果不完整。

特定的数据可观察性解决方案会将综合的数据质量分析、存储和托管功能集成在一个平台中。这种方法消除了将这些服务卸载到被监视系统的需要,有效地减少了相关的费用。此外,这种方法还提供了可扩展性,能够在整个数据中检测数据质量问题,而不是仅仅依赖于样本。

衡量影响:将这些成本分解为:

  • 与验证查询相关的数据库超额费用%。
  • 用于保留历史数据质量指标的额外存储成本%。
  • 用于支持大规模数据质量的超额云托管费用%。

公式:ROI =(年度数据仓库成本*与数据验证查询相关的超额成本%)+(年度存储成本*存储历史数据质量指标的超额成本%)+(年度云基础设施成本*用于大规模托管数据质量的超额成本%)。

在许多组织中,基础设施成本通常与提供全面服务(包括数据仓库、存储和云托管)的单一供应商合并。在这种情况下,计算ROI需要将总基础设施成本*一定百分比(通常在10%到20%之间),以显示数据质量监控增加的影响。例如,如果一个组织每年的云数据仓库费用为100万美元,那么实施数据质量和可观察性可能会产生10%的间接影响,相当于每年10万美元。

3.减少事件管理案例

事件管理通常是对数据质量问题的被动性响应。通过数据可观察性转向主动预防是理想的方案,但却并非总是可行的。当数据质量问题导致下游系统不准确,影响业务应用程序甚至波及到客户时,业务团队通常会参与识别、调查和解决问题。这会影响到更广泛的组织,应该在数据可观察性解决方案的ROI分析中考虑到这一点。

衡量影响:数据团队通常根据严重程度对事件管理进行分类。例如,一家公司将其数据事件分类如下:

小型事件:

  • 数量:每sprint(开发周期) 0-1个;
  • 解决时间:2-3天;
  • 参与人数:1人;

中型事件:

  • 数量:3-4个/季度;
  • 解决时间:3-4天;
  • 参与人数:2人;

关键事件:

  • 数量:1-2个/年;
  • 解决时间:5-10天;
  • 参与人数:10人;

为了简化,您可以将事件分组并计算所有成本驱动因素的平均值。

  • 每年平均事故数。
  • 解决事件的平均时间(以小时为单位)。
  • 正确检测和修复这些问题的平均每小时成本。

公式:ROI =(每年平均事件数量)*(发现和解决事件的平均时间,以小时为单位)*(平均每小时成本)

4. 为更好的决策创建可信数据

虽然上述三个ROI收益主要集中在成本节约上,但后两个则深入研究了实现数据可观察性所带来的潜在收入增长。

确定数据可观察性带来多少直接收益可能很复杂。例如,如果数据可观察性提高了客户数据质量并提高了留存率,这并不仅仅是因为可观察性;其他因素,如员工的能力或最近的产品改进也可能起作用。

为了计算ROI,需要定义问题范围并衡量数据可观察性对改进的潜在影响。

测量影响:定义问题陈述、问题的基线值,以及可归因于数据可观察性的改进部分。举个例子:

问题陈述:“不准确的数据阻碍了我们的业务目标,例如客户保留率。”

基线值:“不准确的数据导致组织的年成本高达X美元。”

目标范围:“考虑到由于数据质量以外的因素,一些收入损失是我们业务固有的,我们预计将改进Y%。”

来自数据可观察性的预期改进:“我们预期Z%的改进可以归功于数据可观察性解决方案。”

公式:ROI =基线值(X美元)*目标范围(Y%) *预期改进(Z%)

值得注意的是,虽然数据可观察性有助于这种改进,但它只是影响数据质量的几个因素中的一个。其他因素还包括提高团队技能、精简流程、进行彻底的研究,以及在数据可观察性之外集成补充工具。

5. 加快数据产品实现价值的时间

数据产品越来越受欢迎,但它们的成功依赖于高质量的数据。数据可观察性保证了一种及时发现和识别数据问题的系统方法。这种方法不仅加快了数据产品的上市时间,而且还建立了实时分析和补救流程,以确保消费者访问这些产品时的可靠性。

衡量影响:为了计算对数据产品的影响,评估由数据质量和一致性问题导致的上市时间延迟是必不可少的。一些数据可观察性工具提供低代码、无代码的接口,促进业务用户和技术用户之间的协作。这加快了数据质量的开发和测试,帮助您更快地实现收入目标。这些工具使用机器学习(ML)来评估数据质量,识别异常值和异常情况,简化了耗时且依赖猜测的流程。

此外,这些可观察性平台利用历史数据趋势实时检测意外数据问题。这种实时监控功能使产品和工程团队能够确保数据产品的持续健康和可靠性,从而促进收入增长。

公式:ROI =数据产品每年的年收入*因数据不良导致的延迟上市时间

结语

以上仅仅是数据可观察性能够带来巨大业务利益的五个领域。虽然并非所有情况都适用于每个组织,但每种情况在实现数据可观察性的潜在价值方面都起着至关重要的作用。在开发业务案例时,请与执行团队一起审查此框架,并考虑所有成本驱动因素和产生收入的机会。将总投资回报率记录和分解为一个明确的实施时间表。数据可观察性不仅仅是一项支出,更是一项投资。它减少了用于故障排除和纠正数据问题的时间和资源,降低了基础设施成本,加速了数据产品的生产,并最终帮助组织增加收益。

原文标题:Data Observability ROI: 5 Key Areas to Construct a Compelling Business Case,作者:Farnaz Erfan



Tags:数据   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08  Search: 数据  点击:(6)  评论:(0)  加入收藏
国家数据局首次召开全国性工作会议 释放哪些信号?
数据工作不仅事关经济社会发展、人们生产生活,也关乎国家发展与安全大局,其重要性不言而喻。我国是数据生产和应用大国,也是世界上首个提出数据要素理论的国家。正因为此,全国数...【详细内容】
2024-04-07  Search: 数据  点击:(3)  评论:(0)  加入收藏
向量数据库落地实践
本文基于京东内部向量数据库vearch进行实践。Vearch 是对大规模深度学习向量进行高性能相似搜索的弹性分布式系统。详见: https://github.com/vearch/zh_docs/blob/v3.3.X/do...【详细内容】
2024-04-03  Search: 数据  点击:(4)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02  Search: 数据  点击:(7)  评论:(0)  加入收藏
数据可视化在网络安全中的关键作用
在当今数字化时代,网络安全已成为各大企业乃至国家安全的重要组成部分。随着网络攻击的日益复杂和隐蔽,传统的网络安全防护措施已难以满足需求,急需新型的解决方案以增强网络防...【详细内容】
2024-03-29  Search: 数据  点击:(19)  评论:(0)  加入收藏
如何正确选择NoSQL数据库
译者 | 陈峻审校 | 重楼Allied Market Research最近发布的一份报告指出,业界对于NoSQL数据库的需求正在持续上升。2022年,全球NoSQL市场的销售额已达73亿美元,预计到2032年将达...【详细内容】
2024-03-28  Search: 数据  点击:(13)  评论:(0)  加入收藏
京东小程序数据中心架构设计与最佳实践
一、京东小程序是什么京东小程序平台能够提供开放、安全的产品,成为品牌开发者链接京东内部核心产品的桥梁,致力于服务每一个信任我们的外部开发者,为不同开发能力的品牌商家提...【详细内容】
2024-03-27  Search: 数据  点击:(9)  评论:(0)  加入收藏
为什么数据库连接池不采用 IO 多路复用?
这是一个非常好的问题。IO多路复用被视为是非常好的性能助力器。但是一般我们在使用DB时,还是经常性采用c3p0,tomcat connection pool等技术来与DB连接,哪怕整个程序已经变成以...【详细内容】
2024-03-27  Search: 数据  点击:(12)  评论:(0)  加入收藏
Google搜索引擎索引的网页数量有多少?谷歌官方提供数据进行参考
Google搜索引擎索引的网页数量有多少?二十世纪九十年代,网页的索引数量成了一个各大搜索引擎相互对比的指标。小编记得2000年谷歌搜索引擎的首页搜索框上方,还标记着谷歌索引的...【详细内容】
2024-03-27  Search: 数据  点击:(12)  评论:(0)  加入收藏
八个常见的数据可视化错误以及如何避免它们
在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将探讨一些常见的糟糕数据可...【详细内容】
2024-03-26  Search: 数据  点击:(6)  评论:(0)  加入收藏
▌简易百科推荐
向量数据库落地实践
本文基于京东内部向量数据库vearch进行实践。Vearch 是对大规模深度学习向量进行高性能相似搜索的弹性分布式系统。详见: https://github.com/vearch/zh_docs/blob/v3.3.X/do...【详细内容】
2024-04-03  京东云开发者    Tags:向量数据库   点击:(4)  评论:(0)  加入收藏
原来 SQL 函数是可以内联的!
介绍在某些情况下,SQL 函数(即指定LANGUAGE SQL)会将其函数体内联到调用它的查询中,而不是直接调用。这可以带来显著的性能提升,因为函数体可以暴露给调用查询的规划器,从而规划器...【详细内容】
2024-04-03  红石PG  微信公众号  Tags:SQL 函数   点击:(3)  评论:(0)  加入收藏
如何正确选择NoSQL数据库
译者 | 陈峻审校 | 重楼Allied Market Research最近发布的一份报告指出,业界对于NoSQL数据库的需求正在持续上升。2022年,全球NoSQL市场的销售额已达73亿美元,预计到2032年将达...【详细内容】
2024-03-28    51CTO  Tags:NoSQL   点击:(13)  评论:(0)  加入收藏
为什么数据库连接池不采用 IO 多路复用?
这是一个非常好的问题。IO多路复用被视为是非常好的性能助力器。但是一般我们在使用DB时,还是经常性采用c3p0,tomcat connection pool等技术来与DB连接,哪怕整个程序已经变成以...【详细内容】
2024-03-27  dbaplus社群    Tags:数据库连接池   点击:(12)  评论:(0)  加入收藏
八个常见的数据可视化错误以及如何避免它们
在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将探讨一些常见的糟糕数据可...【详细内容】
2024-03-26  DeepHub IMBA  微信公众号  Tags:数据可视化   点击:(6)  评论:(0)  加入收藏
到底有没有必要分库分表,如何考量的
关于是否需要进行分库分表,可以根据以下考量因素来决定: 数据量和负载:如果数据量巨大且负载压力较大,单一库单一表可能无法满足性能需求,考虑分库分表。 数据增长:预估数据增长...【详细内容】
2024-03-20  码上遇见你  微信公众号  Tags:分库分表   点击:(13)  评论:(0)  加入收藏
在 SQL 中写了 in 和 not in,技术总监说要炒了我……
WHY?IN 和 NOT IN 是比较常用的关键字,为什么要尽量避免呢?1、效率低项目中遇到这么个情况:t1表 和 t2表 都是150w条数据,600M的样子,都不算大。但是这样一句查询 ↓select *...【详细内容】
2024-03-18  dbaplus社群    Tags:SQL   点击:(5)  评论:(0)  加入收藏
应对慢SQL的致胜法宝:7大实例剖析+优化原则
大促备战,最大的隐患项之一就是慢SQL,对于服务平稳运行带来的破坏性最大,也是日常工作中经常带来整个应用抖动的最大隐患,在日常开发中如何避免出现慢SQL,出现了慢SQL应该按照什...【详细内容】
2024-03-14  京东云开发者    Tags:慢SQL   点击:(4)  评论:(0)  加入收藏
过去一年,我看到了数据库领域的十大发展趋势
作者 | 朱洁策划 | 李冬梅过去一年,行业信心跌至冰点2022 年中,红衫的一篇《适应与忍耐》的报告,对公司经营提出了预警,让各个公司保持现金流,重整团队,想办法增加盈利。这篇报告...【详细内容】
2024-03-12    InfoQ  Tags:数据库   点击:(25)  评论:(0)  加入收藏
SQL优化的七个方法,你会哪个?
一、插入数据优化 普通插入:在平时我们执行insert语句的时候,可能都是一条一条数据插入进去的,就像下面这样。INSERT INTO `department` VALUES(1, '研发部(RD)', &#39...【详细内容】
2024-03-07  程序员恰恰  微信公众号  Tags:SQL优化   点击:(19)  评论:(0)  加入收藏
站内最新
站内热门
站内头条