您当前的位置:首页 > 互联网百科 > 大数据

整了9种最常用的数据分析方法!

时间:2022-09-21 14:24:26  来源:网易号  作者:数据不吹牛

一、关联分析

关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。

关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。

关联分析需要考虑的常见指标:

 

  • 支持度:指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。

  • 置信度:指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。

  • 提升度:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值。

     

二、对比分析

对比法就是用两组或两组以上的数据进行比较。对比法是一种挖掘数据规律的思维,能够和任何技巧结合,一次合格的分析一定要用到N次对比。

对比主要分为以下几种:

 

  • 横向对比:同一层级不同对象比较,如江苏不同市茅台销售情况。

  • 纵向对比:同一对象不同层级比较,如江苏南京2021年各月份茅台销售情况。

  • 目标对比:常见于目标管理,如完成率等。

  • 时间对比:如同比、环比、月销售情况等,很多地方都会用到时间对比。

     

 

 

三、聚类分析


聚类分析属于探索性的数据分析方法。从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。

在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。

以最为常见的K-means为例,可以看到,数据可以被分到黄蓝绿三个不同的簇(cluster)中,每个簇有其特有的性质。

 

四、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

按照不同周期,留存率分为三类:

第一种是日留存,日留存又可以细分为以下几种:

 

  • 次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;

  • 第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;

  • 第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;

  • 第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;

  • 第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。

     

第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。

留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。

下面以月留存为例生成的月用户留存曲线:

 

五、帕累托分析

帕累托法则,源于经典的二八法则——“世界上80%的财富掌握在20%的富人手里”。而在数据分析中,这句话可以理解为20%的数据产生了80%的效果,需要围绕找到的20%有效数据进行挖掘,使之产生更大的效果。

比如一个商超进行产品分析的时候,就可以对每个商品的利润进行排序,找到前20%的产品,那这些产品就是能够带来较多价值的商品,可以再通过组合销售、降价销售等手段,进一步激发其带来的收益回报。

帕累托法则一般会用在产品分类上,此时就表现为ABC分类。常见的做法是将产品SKU作为维度,并将对应销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算累计销售额占比。

百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。

按照A、B、C分组对产品进行了分类,根据产品的效益分为了三个等级,这样就可以针对性投放不同程度的资源,来产出最优的效益。

 

六、象限分析

象限法是通过对两种及以上维度的划分,运用坐标的方式,人工对数据进行划分,从而传递数据价值,将之转变为策略。象限法是一种策略驱动的思维,常应用在产品分析、市场分析、客户管理、商品管理等场景,像RFM模型、波士顿矩阵都是象限法思维。

下面这个RFM模型就是利用象限法,将用户分为8个不同的层级,从而对不同用户制定不同的营销策略。

象限法的优势:

(1)找到问题的共性原因

通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

(2)建立分组优化策略

针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

 

七、ABtest

A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。

A/Btest的流程如下:

 

  1. 现状分析并建立假设分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了。

     

  2. 设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。

     

  3. 设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。

     

  4. 分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。

     

  5. 采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。

     

  6. 最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。
     

     

八、漏斗分析

漏斗思维本质上是一种流程思路,在确定好关键节点之后,计算节点之间的转化率。这个思路同样适用于很多地方,像电商的用户购买路径分析、app的注册转化率等等。

上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。

整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

著名的海盗模型AARRR模型就是以漏斗模型作为基础的,从获客、激活、留存、变现、自传播五个关键节点,分析不同节点之间的转化率,找到能够提升的环节,采取措施。

 

九、路径分析

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。

如何进行用户行为路径分析?

 

  1. 计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。

  2. 查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。

  3. 进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。

  4. 通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。

  5. 对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

 

以上。



Tags:数据分析   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
一、关联分析关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。关联分析目的是找到事务间的关联性,用以指导决...【详细内容】
2022-09-21  Tags: 数据分析  点击:(0)  评论:(0)  加入收藏
近日,三大运营商发布了8月份的运营数据。整体来看,三大运营商八月份的表现和本年的前几月相差不大。移动用户方面,中国移动连续数月超过中国电信;5G用户数量方面,三家之间的差距...【详细内容】
2022-09-21  Tags: 数据分析  点击:(4)  评论:(0)  加入收藏
近几年,因为数据分析行业的繁荣,很多人选择入行或者转行做数据分析。比较突出的表现就是在知乎上搜索数据分析,出现的大多是关于如何转行数据分析的提问。但是,小编想说,在你对一...【详细内容】
2022-08-25  Tags: 数据分析  点击:(26)  评论:(0)  加入收藏
从以下几个方面来看数据分析思维及其方法论: 去餐厅吃饭师,如果你仔细观察的话,餐厅大致可以分为以下两类付费模式:1)使用大众点评优惠吸引用户结账2)直接使用微信或支付宝结账 这...【详细内容】
2022-08-10  Tags: 数据分析  点击:(22)  评论:(0)  加入收藏
萌新小白如何开始数据分析?专职想做数据分析该如何开始??大部分人听到“数据分析”,都觉得这是一个非常高大上的词汇,似乎高不可攀。 但在我看来,数据分析并不是一种冷冰冰的工作...【详细内容】
2022-07-21  Tags: 数据分析  点击:(66)  评论:(0)  加入收藏
“小王,你把这些用户数据分析下,分别打个价值标签给我,我们制定一下618的营销活动。”这时候你拿着用户数据一脸懵?打标签?从哪几个维度?脑海里仿佛有很多想法,但又不知道从何做起...【详细内容】
2022-05-30  Tags: 数据分析  点击:(45)  评论:(0)  加入收藏
Python是非常接近人类语言的一门计算机语言,简单易懂的语法,可以让我们更好的理解,还有强大的第三方库,程序编辑的效率也可以大幅度提高。 《关于全面开展中小学生人工智能教育...【详细内容】
2022-05-25  Tags: 数据分析  点击:(96)  评论:(0)  加入收藏
本文作者 | 经韬纬略智库全文 4586 字 数据是数字化的证据——没有记录下来的事情就没有发生过 追溯——追责、求根源、求真相 监控——监...【详细内容】
2022-05-06  Tags: 数据分析  点击:(109)  评论:(0)  加入收藏
又是一年春招季,你最近有为找工作或换工作而犯愁吗?现在已经进入春招的“金三银四”决赛圈了,再不好好准备真的是黄花菜都要凉了。那么如何才能在“岗少人多”、“僧多粥少”的...【详细内容】
2022-04-13  Tags: 数据分析  点击:(75)  评论:(0)  加入收藏
大家好,我是老班~很多读者问过我,文章中的Python代码都是用的什么编辑器写的?今天就公开啦:Jupyter Notebook,没有Pycharm,没有Vscode,没有Sublime text。只有一款工具:Jupyter Note...【详细内容】
2022-04-12  Tags: 数据分析  点击:(93)  评论:(0)  加入收藏
▌简易百科推荐
一、关联分析关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。关联分析目的是找到事务间的关联性,用以指导决...【详细内容】
2022-09-21  数据不吹牛   网易号  Tags:数据分析   点击:(0)  评论:(0)  加入收藏
目录 1. Shopee 数据系统建设中面临的典型问题 2. 为什么选择 Hudi 3. Shopee 在 Hudi 落地过程中的实践 4. 社区贡献 5. 总结与展望湖仓一体(LakeHouse)作为大数据领域的重...【详细内容】
2022-09-14  Lakehouse  今日头条  Tags:Apache Hudi   点击:(21)  评论:(0)  加入收藏
其实,在互联网时代,每个人都是透明的。你在注册各种账号时,基本已经把个人信息泄露出去了。当你看新闻,刷短视频,网络购物时,大数据就会根据你的平时喜欢,不断推送类似的内容和商品给你。...【详细内容】
2022-09-13  数字财经智库  搜狐网  Tags:大数据   点击:(15)  评论:(0)  加入收藏
数据开发技术方向主要有数据仓库、在线分析处理(OLAP)以及数据挖掘三部分组成。一、数据仓库:架构1.数据仓库 Data Warehouse,DW数据仓库是构建面向分析的集成化数据环境,为企业...【详细内容】
2022-08-29  华夏金领大数据  今日头条  Tags:数据开发   点击:(47)  评论:(0)  加入收藏
《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是一个开源机器学习和数据可视化工具——ora...【详细内容】
2022-08-25  互联网资讯看板   网易  Tags:数据可视化   点击:(55)  评论:(0)  加入收藏
近几年,因为数据分析行业的繁荣,很多人选择入行或者转行做数据分析。比较突出的表现就是在知乎上搜索数据分析,出现的大多是关于如何转行数据分析的提问。但是,小编想说,在你对一...【详细内容】
2022-08-25  互联共商   网易  Tags:数据分析   点击:(26)  评论:(0)  加入收藏
先说观点:因为还没找到更好的。接下来说原因,首先来看看大数据平台都在干什么。原因结构化数据计算仍是重中之重大数据平台主要是为了应对海量数据存储和分析的需求,海量数据存...【详细内容】
2022-08-25  大数据推荐杂谈    Tags:大数据平台   点击:(37)  评论:(0)  加入收藏
随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位。日常的业务过程中,需要处理的大量电子文档、图片、音频、视频等,都属于内容数据范畴。例如,某银行的...【详细内容】
2022-08-24  正正杂说    Tags:数据   点击:(28)  评论:(0)  加入收藏
其实大数据行业发展到现在,最大的痛点并不是数据的可视化和分析问题。而是庞大业务数据的预处理。 NO.1 80%-90%的项目时间大量花费在将不同来源的业务系统中的数据传输到同...【详细内容】
2022-08-18  莱牛教育    Tags:大数据   点击:(39)  评论:(0)  加入收藏
数据中台主要功能是进行数据分析,担负公司产品的数据分析工作,数据中台对数据的采集、存储、打通、使用。如何进行数据中心的开发保证数据使用。数据中台的开发流程有哪些?如下...【详细内容】
2022-08-15  梯度云  搜狐号  Tags:数据中台   点击:(19)  评论:(0)  加入收藏
站内最新
站内热门
站内头条