您当前的位置:首页 > 电脑百科 > 数据库 > 百科

5个等级的数据分析,哪个最深入?

时间:2023-05-12 15:47:45  来源:  作者:接地气的陈老师

很多同学总觉数据分析做得不深入,到底该怎么做?今天结合一个具体的例子,分享下如何做一个深入的数据分析项目。

 

深入级别:0级

 

某天,你收到一个需求:“看下我司App新增的A功能,过去5天内累计使用1+次的人有多少(去重)”。这问题太简单了,直接跑个数丢过去即可,“过去5天累计使用人数10000人”搞掂。

 

但是这种分析完全不深入,甚至压根不能叫“分析”,这就是提个数而已。确实,当需求是很具体的取数指标+统计时间的时候,这就是取个数,第0级深入就是如此。

 

深入级别:1级

 

某天,你又收到一个需求:“看下我司APP新增的A功能,过去5天有多少人在用”。

 

听起来和之前的问题差不多,但注意,“多少人”并不是一个明确的指标,只是个笼统的说法,细分起来,有:

1.5天内累计使用1+次的人(去重)

2.5天内累计有多少人次使用(不去重)

3.5天内,每天有多少人在使用

4.5天内,累计使用5、4、3、2、1天的人有多少

5.5天内,各使用频次人数(1、2、3……10、10+次)

……

 

好几个指标拼起来,才能把这个多少人说明白。有些同学会觉得,这么搞是不是太麻烦了。我就默认他是看不去重的人次呗。实际上,工作中相当多的重复取数,加班加点,被业务追着屁股催数,就是从“没确认清楚需求,自己默认一个业务不想要的指标”开始的。特别是你问业务:想看哪个口径。业务会说:都看。这时候最好自己先提前想多几个,避免重复返工。

 

这种主动思考,才是深入分析的起点。因为这几个指标对业务都有用:

1.   看去重的人数,可以评估总用户渗透了多少

2.   看每天人次,可以看出发展趋势

3.   看各类型累计使用天数,可以判断有多少重度用户

4.   看各类型累计使用天数,可以判断有多少重度用户

 

 

图片

 

 

而且,我们发现,第0级的成果,成为第1级产出的一部分。后续也是一样,越深入,设计的指标、维度越多,问题会越复杂。

 

深入级别:2级

 

某天,你又收到一个需求:“看下我司APP新增的A功能,过去5天使用的人,付费行为是不是比其他人更好”。

 

注意,这里也没有明确的数据指标,因此得先拆解问题:

1、主语是:过去5天使用过A功能的用户。那得先知道有多少人在用?第1级深入的数据,这里都需要加上。

2、付费行为:付费行为是个笼统说法。是付费金额,还是频次?没说清就先都拎出来看。

3、比其他人更好:什么是其他人?是全体用户,还是未使用该功能用户。从问题场景上看,应该区分出过去5天内未使用过该功能,并且至少活跃1次的用户,这样才有可比性。

 

有了这三步拆解。可以把这句不清晰的需求,落地成一个取数需求:

1.   过去5天内使用过A功能用户基本情况(人数,使用天数分布,使用频次分布)

2.   过去5天内使用过A功能用户付费行为(多大比例,付费人群的5天内累计付费金额,5天内付费频次,人均付费金额,人均付费次数)

3.   过去5天内未未使用过A功能,且活跃的用户的活跃天数、付费比例,付费金额,付费频次,人均付费金额,人均付费次数)

 

 

图片

 

 

这样,两个群体一对比,就能出结论了。然而这么做,很快会引发下一个问题:“为什么使用A的人群比其他群体高/低?”

 

深入级别:3级

 

某天,你又收到一个需求:“分析下为啥使用A功能的人付费更好?”注意,先问是不是,再问为什么,是回答问题的基本要求。因此在拆解问题的时候,得先把深入2级功课都做完。做实了“A的付费更好”以后再分析原因。

 

分析原因的时候,假设很重要。需求既然关注A功能,那A功能到底有没有用就是关键。在分析原因的时候,证伪比证真更容易,所以我们可以先剔除一些明显的错误答案,比如“A功能用户本身都是高付费群体”,这一下就能把“A功能对付费转化有用”直接干掉。

 

 

图片

 

 

 

但这样,逻辑上还是站不住,因为:

1.   本身消费高,但是用了A功能以后消费更高了

2.   本身消费高,但是比不用A的人更高

3.   消费低的人,用了A也有提高

4.   消费低的人,不用A只会更低

……

 

即使看到数据:A群体消费天然比不用的高,还是有至少这4种可能性要排除。所以得列清楚假设逻辑树,逐一排查可能性。这也是我们说的:验证观点,需要同时找正反两面的例子。

 

 

图片

 

 

注意,即使这样,还是有反驳观点。因为我们都是基于过去数据分析,很有可能一个反驳观点是:“A功能只能吸引到这一小簇用户,不能做大”或者“A用户只是尝新,过了这段时间就没有效果了”这两个观点,都涉及未来数据情况,因此需要观察一段时间才能有结论。

 

 

图片

 

 

如果我们等不了那么久,还可以做测试,比如测试:“做不大”这个点,可以主动向其他群体推广A功能,观察A功能增量以及留存效果,如果增量少,或者有增量但是留存差,那就可以推论:确实做不大。想要做深入分析,测试与长期观察是不可少的,好结论需要时间沉淀。

 

深入级别:4级

 

某天,你又收到一个需求:“分析下A功能对用户有啥影响?”看起来问题表达更简单了,可要解这个问题却更复杂了。因为从0级到3级,我们只讨论了“付费”这一个影响,实际上还有可能有更多影响,比如活跃、留存、转介绍等等。每个方向都得经历这么漫长的拆分、分析,才能得出综合结果。

 

 

图片

 

 

到这里,我们的分析已经非常有深度了。有趣的是,我们的问题,反而非常简单。实际上,如果一个问题:

1.   有清晰的衡量指标

2.   有明确的判断指标好坏的标准

3.   有明显的指标间影响逻辑

4.   基于封闭的业务场景,容易测试

那这个问题就是很容易解决的。

 

可现实中的问题,常常是:

1.     口语化表达的

2.     包含了多个方面的

3.     没有清晰判断标准的

4.     杂糅了很多影响因素

5.     没有时间、场地给我们慢悠悠测试

 

这时候就能从头开始,一点点梳理。把本篇文章的顺序倒出来,就是从0开始梳理业务问题的场景。

 

当然,并不是所有的分析都需要这样从头到尾过一遍。

有可能提问人自己完全没概念,此时可以先给到1级深度数据,让他建立认知,再给2级深度的数据,引导他关注差异。

有可能提问人嘴上说得含糊,但心里有明确的目标,这时候可以进行深入沟通,清晰需求。

有可能提问的人不需要严密的论证,有部分证据即打算直接下结论,这时论证其最疑惑的点即可

这时候唯一不要干的,就是不沟通,自己拍脑袋随便仍几个数,或者到网上找所谓“模型”生搬硬套。这样闭门造车,返工、加班、被diss都是经常的事。

 

如果在某个业务场景下,我们已经做了很多次验证,论证了业务问题的关键指标+判断标准+因果关系,这时候就可以直接套用,这就是我们说的:业务分析模型。不过在沉淀出来之前,还是得多做论证的,特别是因果关系论证,做的不够细致,分分钟被打脸。



Tags:数据分析   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
自媒体运营 运营媒体数据分析怎么写
数据分析之旅自媒体运营工作充满挑战,但也令人陶醉。在此,我愿意与您分享我在该领域的八段独特体验及感悟。1.初入行业的激动与迷茫初识数据分析及自媒体运营领域,我心潮澎湃,对...【详细内容】
2024-01-26  Search: 数据分析  点击:(41)  评论:(0)  加入收藏
抖音万粉达人,是怎么做数据分析的?
在运营抖音账号的过程中,我们需要建立起对于抖音账号、短视频、直播等数据整体的认知,才能够对照实际数据去科学调整阶段性的运营目标,实现持续变现。那么知识达人该如何对抖音...【详细内容】
2024-01-15  Search: 数据分析  点击:(56)  评论:(0)  加入收藏
使用Python进行数据分析,需要哪些步骤?
Python是一门动态的、面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言。Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读一篇外语文章。Python这种特...【详细内容】
2024-01-15  Search: 数据分析  点击:(166)  评论:(0)  加入收藏
网站优化数据你分析过吗?做SEO优化离不开数据分析
作为一名网站管理员,你是否曾经感到困惑,为什么你的网站在搜索引擎中的排名总是不如人意?为什么你的网站流量总是无法突破某个瓶颈?其实,这些问题很可能是因为你忽略了网站优化数...【详细内容】
2024-01-01  Search: 数据分析  点击:(59)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19  Search: 数据分析  点击:(41)  评论:(0)  加入收藏
在Linux系统中实现容器化的大规模数据分析平台:Hadoop和Spark
在Linux系统中实现容器化的大规模数据分析平台,我们可以利用Hadoop和Spark这两个强大的开源工具。Hadoop是一个分布式计算框架,适用于处理大规模数据集。它提供了分布式文件系...【详细内容】
2023-12-15  Search: 数据分析  点击:(155)  评论:(0)  加入收藏
数据库优化:提升网站SEO数据分析能力的关键
摘要:在当今数字化时代,网站的SEO(搜索引擎优化)数据分析能力对于吸引流量和提升用户体验至关重要。而数据库优化作为一项关键的技术手段,能够显著提升网站的数据处理效率和分析...【详细内容】
2023-12-13  Search: 数据分析  点击:(121)  评论:(0)  加入收藏
高级数据分析师必备的八大能力
到底高级的数据分析师需要啥能力?这是很多人心中的疑惑。网上流行的都是Excel,SQL,Python,都是数据分析从0到1,那到底从1到100该弄些啥?陈老师给大家准备了一个《数据分析年底盘点...【详细内容】
2023-11-29  Search: 数据分析  点击:(64)  评论:(0)  加入收藏
Python:打造可视化数据分析应用的实战指南!
随着数据科学和人工智能的快速发展,数据分析变得越来越重要。在数据分析的过程中,可视化是一个非常关键的环节。它可以帮助我们更好地理解数据、发现规律和趋势。Python作为一...【详细内容】
2023-11-24  Search: 数据分析  点击:(229)  评论:(0)  加入收藏
聚类算法在大规模数据分析中的效果评估
在大规模数据分析中,聚类算法是一种常用的数据挖掘技术,用于将数据集划分为具有相似特征的群组。然而,对于大规模数据集,评估聚类算法的效果变得尤为重要。本文将探讨聚类算法在...【详细内容】
2023-11-21  Search: 数据分析  点击:(271)  评论:(0)  加入收藏
▌简易百科推荐
向量数据库落地实践
本文基于京东内部向量数据库vearch进行实践。Vearch 是对大规模深度学习向量进行高性能相似搜索的弹性分布式系统。详见: https://github.com/vearch/zh_docs/blob/v3.3.X/do...【详细内容】
2024-04-03  京东云开发者    Tags:向量数据库   点击:(5)  评论:(0)  加入收藏
原来 SQL 函数是可以内联的!
介绍在某些情况下,SQL 函数(即指定LANGUAGE SQL)会将其函数体内联到调用它的查询中,而不是直接调用。这可以带来显著的性能提升,因为函数体可以暴露给调用查询的规划器,从而规划器...【详细内容】
2024-04-03  红石PG  微信公众号  Tags:SQL 函数   点击:(4)  评论:(0)  加入收藏
如何正确选择NoSQL数据库
译者 | 陈峻审校 | 重楼Allied Market Research最近发布的一份报告指出,业界对于NoSQL数据库的需求正在持续上升。2022年,全球NoSQL市场的销售额已达73亿美元,预计到2032年将达...【详细内容】
2024-03-28    51CTO  Tags:NoSQL   点击:(14)  评论:(0)  加入收藏
为什么数据库连接池不采用 IO 多路复用?
这是一个非常好的问题。IO多路复用被视为是非常好的性能助力器。但是一般我们在使用DB时,还是经常性采用c3p0,tomcat connection pool等技术来与DB连接,哪怕整个程序已经变成以...【详细内容】
2024-03-27  dbaplus社群    Tags:数据库连接池   点击:(13)  评论:(0)  加入收藏
八个常见的数据可视化错误以及如何避免它们
在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将探讨一些常见的糟糕数据可...【详细内容】
2024-03-26  DeepHub IMBA  微信公众号  Tags:数据可视化   点击:(7)  评论:(0)  加入收藏
到底有没有必要分库分表,如何考量的
关于是否需要进行分库分表,可以根据以下考量因素来决定: 数据量和负载:如果数据量巨大且负载压力较大,单一库单一表可能无法满足性能需求,考虑分库分表。 数据增长:预估数据增长...【详细内容】
2024-03-20  码上遇见你  微信公众号  Tags:分库分表   点击:(15)  评论:(0)  加入收藏
在 SQL 中写了 in 和 not in,技术总监说要炒了我……
WHY?IN 和 NOT IN 是比较常用的关键字,为什么要尽量避免呢?1、效率低项目中遇到这么个情况:t1表 和 t2表 都是150w条数据,600M的样子,都不算大。但是这样一句查询 ↓select *...【详细内容】
2024-03-18  dbaplus社群    Tags:SQL   点击:(6)  评论:(0)  加入收藏
应对慢SQL的致胜法宝:7大实例剖析+优化原则
大促备战,最大的隐患项之一就是慢SQL,对于服务平稳运行带来的破坏性最大,也是日常工作中经常带来整个应用抖动的最大隐患,在日常开发中如何避免出现慢SQL,出现了慢SQL应该按照什...【详细内容】
2024-03-14  京东云开发者    Tags:慢SQL   点击:(5)  评论:(0)  加入收藏
过去一年,我看到了数据库领域的十大发展趋势
作者 | 朱洁策划 | 李冬梅过去一年,行业信心跌至冰点2022 年中,红衫的一篇《适应与忍耐》的报告,对公司经营提出了预警,让各个公司保持现金流,重整团队,想办法增加盈利。这篇报告...【详细内容】
2024-03-12    InfoQ  Tags:数据库   点击:(27)  评论:(0)  加入收藏
SQL优化的七个方法,你会哪个?
一、插入数据优化 普通插入:在平时我们执行insert语句的时候,可能都是一条一条数据插入进去的,就像下面这样。INSERT INTO `department` VALUES(1, '研发部(RD)', &#39...【详细内容】
2024-03-07  程序员恰恰  微信公众号  Tags:SQL优化   点击:(20)  评论:(0)  加入收藏
站内最新
站内热门
站内头条