您当前的位置:首页 > 互联网百科 > 大数据

这是我见过最【准确】的数据诊断模型

时间:2023-09-05 17:40:18  来源:  作者:接地气的陈老师

你会用数据下判断吗?

你怎么确定你的判断是准确的?

现在业务说你判断错了,你怎么应对?

用数据下判断,是看似简单,实则极大影响数据分析结果的一个问题。同样是本月销售业绩1000万,如果判断是:业绩很好。那么下一步的分析就是总结成功经验。如果判断是:业绩很差。那么下一步的分析就是发现问题,寻找方案。

1  数据诊断问题,为啥那么难

这一点看似简单,可网上90%的文章教的是错的。

网文的逻辑,一般是:

·环比下跌了,所以不好,要搞高

·同比下跌了,所以不好,要搞高

·你去问问业务,业务说好就是好

谁规定的跌就是不好?如果是自然波动呢,如果是计划内的调整呢,如果是营销之后调整期呢?如果是生命周期末尾呢?如果下跌但是KPI仍然达标呢?太多情况了。然后一堆网文还在一本正经的《指标下跌六大分析方法》连啥指标,啥场景都不细讲,分析个屁。

问业务同样有问题。因为你挡不住业务浑水摸鱼。丫今天说好,明天说不好,后天说:请数据分析深入分析到底好不好,大后天再说:你这分析不符合业务直觉。甚至明明KPI达标了,丫还让“你深入分析KPI达标背后的隐藏危机……”

O(╯□╰)o

那么,到底该咋办呢。

2 核心问题:诊断标准

做判断的核心是:找标准。标准涉及到后续轻重缓急及原因判断。一定要事先分清楚。而上文讲到的网文的各种错误,本质上都是来自于不考虑业务场景,瞎胡判断。如果结合业务场景来看的话,有四类典型的场景(如下图)。

这是我见过最【准确】的数据诊断模型

1、有客观要求。供应链上大部分指标都有物流、化学、交付周期等等客观要求。比如生产质量、产品尺寸、交货时间。这些也被称作硬指标。这种情况下是可以直接拿来做评价标准的。

2、主要要求,但是负向指标。比如客户投诉,虽然大家都知道投诉是不可避免的,但是还是希望越少越好,负向指标标准也好找,只要一直处于下跌趋势,不反弹,就算是好。

3、主观,正向,但是有上一级KPI压力。类似销售业绩,GMV,新用户数,很有可能上一级领导、部门直接塞了个指标给我们。这时候想保住自己的年终奖,就得不惜一切代价地搞掂指标。这个标准可以直接拿来用(这也算硬指标)。

这时候要做好的是硬指标的分配。因为指标达成不是一蹴而就的,可能与业务自然周期、生命周期有关,也有可能与业务作战部署有关系。因此分解任务的时候不要简单地按时间平均,而是根据业务走势,分摊成一个合理数值。

这是我见过最【准确】的数据诊断模型

4、主观,正向,需要你自己定KPI。这是最纠结的状况,老板让你做开放题。虽然明知道自己做了他不用会用,但是他还是让你讲一堆道理,不然就怪你:没有深度分析!如果一定要凭空定指标,怎么办呢?

答:用场景还原法,去找一个标杆。

3 关键方法:场景还原

场景还原,是从业务场景中提炼出数据标准,主要用于营销、运营这种缺少硬指标且指标间相互关联多的场景。你问业务方指标是多少,估计他想不出来。

但是你问他上一次老板龙颜大悦,上一次被表彰,上一次顺风顺水什么时候,他一清二楚。同样,你问上一次他手忙脚乱,上一次被痛骂,上一次跟头流希是啥时候,他也一清二楚。这样我们就能得到正面场景和负面场景。

正面场景,用来做整体的预计目标。这是个把语文作业转化为数学作业的过程。比如:

·我们要在三年内成为行业第一

·我们要在1年内扭亏为赢

·我们要在4季度做出爆款活动

有了这些场景,可以转化为具体标准(如下图)。

这是我见过最【准确】的数据诊断模型

负面场景,用来设定保障型指标的标准。比如:

·新用户注册很多,但是转化太低

·业绩增长很快,库存涨的更快

·收入指标达标,成本超支严重

有了这些场景,可以转化为具体标准(如下图)。

这是我见过最【准确】的数据诊断模型

经过梳理,输出的判断标准,就是一个有逻辑的系列组合(如下图)。

这是我见过最【准确】的数据诊断模型

这样面对业务方或者老板质疑的时候,也能理直气壮地说:既然要达成这个美好愿景,就得做到XX数值。如果不做到XX数值,业务就会出问题。这样面对上文中,业务方反复横跳的场面时,也能拿出白纸黑字来对峙,不要让他把锅甩给我们。可以甩给外部突发因素吗,真是的,干嘛非难为数据分析师。

4  为什么不用算法模型

算法模型不是一个处理标准问题的好办法。用机器学习算法,如果用无监督方法,比如Kmean聚类,本身输出的结果就随着聚类中心变化而变化,不稳定结果不能做标准。如果用有监督的方法,那一开始的“好/坏”标注谁来打?还是得老板来打。看似复杂的算法又变成:请老板酌定。

AHP方法有类似问题,看似两两比较打分很科学,可本质还是:请老板酌定。而且AHP的局部打分,很容易导致整体结果不可控。万一老板不认最终评定结果,非让你改,就非常狼狈了。

这时候还不如直接让老板们坐一桌,拍每个指标权重给多少。这样更简单、高效、不纠结。所以:如果待评价的问题中,正向、非硬指标很多,那还是用场景还原法更好。

标准问题的真正难点是:最后的标准始终要过老板这一关,因此就不可能100%客观。老板自己也会疑虑、纠结、后怕。所以才有了前边说的:虽然老板心里有数,但他还是会让你提标准,并且在你提了以后反复质疑你。其实他是通过这种手段消除自己的疑惑。做数据分析,就是要当老板的贴心小助理,这些问题帮老板想在前头,也是大功一件。

有同学会问:日常遇到的判断问题很多,一个个都这么细致沟通效率太低,很有没有一些简单的方法做判断,答:有。比如我们常说的二八分类,十分位法,趋势分析法,矩阵法,都是简单粗暴的判断方法。



Tags:数据诊断   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
这是我见过最【准确】的数据诊断模型
你会用数据下判断吗?你怎么确定你的判断是准确的?现在业务说你判断错了,你怎么应对?用数据下判断,是看似简单,实则极大影响数据分析结果的一个问题。同样是本月销售业绩1000万,如果...【详细内容】
2023-09-05  Search: 数据诊断  点击:(98)  评论:(0)  加入收藏
▌简易百科推荐
大数据杀熟何时告别“人人喊打却无可奈何”?
2月7日郑州飞往珠海的航班,不同手机、不同账号搜索该航班显示出不同价格。图源网络有网友近日分享在某平台的购票经历,引发社会广泛关注——用3个账号买同一航班同...【详细内容】
2024-01-30    中国青年网  Tags:大数据杀熟   点击:(32)  评论:(0)  加入收藏
简易百科:到底什么是大数据?
随着互联网的快速发展,大数据已经成为了当今社会最热门的话题之一。那么,到底什么是大数据呢?首先,我们需要明确大数据的定义。大数据是指数据量极大、类型繁多、处理难度高的数...【详细内容】
2024-01-30    简易百科  Tags:大数据   点击:(40)  评论:(0)  加入收藏
数据采集新篇章:AI与大模型的融合应用
开篇在AIGC(人工智能与通用计算)应用中,大型语言模型(LLM)占据着举足轻重的地位。这些模型,如GPT和BERT系列,通过处理和分析庞大的数据集,已经极大地推动了自然语言理解和生成的边界...【详细内容】
2024-01-17  崔皓  51CTO  Tags:数据采集   点击:(50)  评论:(0)  加入收藏
挑战 Spark 和 Flink?大数据技术栈的突围和战争
十年的轮回,正如大数据的发展一般,它既是一个轮回的结束,也是崭新的起点。大数据在过去的二十年中蓬勃发展,从无到有,崛起为最具爆炸性的技术领域之一,逐渐演变成为每个企业不可或...【详细内容】
2024-01-17  InfoQ    Tags:大数据   点击:(40)  评论:(0)  加入收藏
分布式存储系统在大数据处理中扮演着怎样的角色?
如果存储节点本身可以定制,则通常会让其支持部分计算能力,以利用数据的亲和性,将部分计算下推到相关的存储节点上。如果存储是云上的 S3 等对象存储,无法定制,则通常会将数据在计...【详细内容】
2023-12-19  木鸟杂记  微信公众号  Tags:大数据   点击:(48)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19    51CTO  Tags:大数据   点击:(41)  评论:(0)  加入收藏
利用生成对抗网络进行匿名化数据处理
在互联网时代,数据日益成为人们的生产资料。然而,在某些情况下,我们需要分享数据,但又需要保护个人隐私。这时,匿名化技术就显得尤为重要。本文将介绍利用生成对抗网络进行匿名化...【详细内容】
2023-12-18  技巧达人小影    Tags:数据处理   点击:(57)  评论:(0)  加入收藏
盘点那些常见的数据中心类型,你知道几个?
在数字化潮流的浪潮下,数据中心如同企业的神经系统,关系到业务的稳健运转。而在这个巨大的网络中,各种数据中心类型如雨后春笋般崭露头角。从企业级的个性至云数据中心的虚拟化...【详细内容】
2023-12-07  数据中心之家  微信公众号  Tags:数据中心   点击:(65)  评论:(0)  加入收藏
数据中心的七个关键特征
随着信息技术的不断演进,数据中心的可靠性、可扩展性、高效性、安全性、灵活性、管理性和可持续性成为业界探讨的焦点。下面让我们一同深入剖析这些关键特征,了解它们是如何影...【详细内容】
2023-12-06  数据中心之家  微信公众号  Tags:数据   点击:(63)  评论:(0)  加入收藏
什么是数据解析?将数据转化为更好的决策
什么是数据解析?数据解析是一门专注于从数据中获取洞察力的学科。它包含数据分析(data analysis)和管理的流程、工具和技术,包括数据的收集、组织和存储。数据解析的主要目的是...【详细内容】
2023-12-06  计算机世界    Tags:数据解析   点击:(62)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条