您当前的位置:首页 > 互联网百科 > 大数据

整了9种最常用的数据分析方法!

时间:2022-09-21 14:24:26  来源:网易号  作者:数据不吹牛

一、关联分析

关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。

关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的货架摆放或捆绑销售可提高超市的服务质量和效益。关联分析在电商分析和零售分析中应用相当广泛。

关联分析需要考虑的常见指标:

 

  • 支持度:指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。

  • 置信度:指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。

  • 提升度:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值。

     

二、对比分析

对比法就是用两组或两组以上的数据进行比较。对比法是一种挖掘数据规律的思维,能够和任何技巧结合,一次合格的分析一定要用到N次对比。

对比主要分为以下几种:

 

  • 横向对比:同一层级不同对象比较,如江苏不同市茅台销售情况。

  • 纵向对比:同一对象不同层级比较,如江苏南京2021年各月份茅台销售情况。

  • 目标对比:常见于目标管理,如完成率等。

  • 时间对比:如同比、环比、月销售情况等,很多地方都会用到时间对比。

     

 

 

三、聚类分析


聚类分析属于探索性的数据分析方法。从定义上讲,聚类就是针对大量数据或者样品,根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类,最终将相似数据分为一组,也就是“同类相同、异类相异”。

在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。

常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。

以最为常见的K-means为例,可以看到,数据可以被分到黄蓝绿三个不同的簇(cluster)中,每个簇有其特有的性质。

 

四、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中, 经过一段时间后仍然存在客户行为(如登录、消费)。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

按照不同周期,留存率分为三类:

第一种是日留存,日留存又可以细分为以下几种:

 

  • 次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数;

  • 第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数;

  • 第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数;

  • 第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数;

  • 第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数。

     

第二种是周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。

第三种是月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。

留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。

下面以月留存为例生成的月用户留存曲线:

 

五、帕累托分析

帕累托法则,源于经典的二八法则——“世界上80%的财富掌握在20%的富人手里”。而在数据分析中,这句话可以理解为20%的数据产生了80%的效果,需要围绕找到的20%有效数据进行挖掘,使之产生更大的效果。

比如一个商超进行产品分析的时候,就可以对每个商品的利润进行排序,找到前20%的产品,那这些产品就是能够带来较多价值的商品,可以再通过组合销售、降价销售等手段,进一步激发其带来的收益回报。

帕累托法则一般会用在产品分类上,此时就表现为ABC分类。常见的做法是将产品SKU作为维度,并将对应销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算累计销售额占比。

百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。

按照A、B、C分组对产品进行了分类,根据产品的效益分为了三个等级,这样就可以针对性投放不同程度的资源,来产出最优的效益。

 

六、象限分析

象限法是通过对两种及以上维度的划分,运用坐标的方式,人工对数据进行划分,从而传递数据价值,将之转变为策略。象限法是一种策略驱动的思维,常应用在产品分析、市场分析、客户管理、商品管理等场景,像RFM模型、波士顿矩阵都是象限法思维。

下面这个RFM模型就是利用象限法,将用户分为8个不同的层级,从而对不同用户制定不同的营销策略。

象限法的优势:

(1)找到问题的共性原因

通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;

(2)建立分组优化策略

针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。

 

七、ABtest

A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。

A/Btest的流程如下:

 

  1. 现状分析并建立假设分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了。

     

  2. 设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。

     

  3. 设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。

     

  4. 分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。

     

  5. 采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。

     

  6. 最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。
     

     

八、漏斗分析

漏斗思维本质上是一种流程思路,在确定好关键节点之后,计算节点之间的转化率。这个思路同样适用于很多地方,像电商的用户购买路径分析、app的注册转化率等等。

上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。

整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。

著名的海盗模型AARRR模型就是以漏斗模型作为基础的,从获客、激活、留存、变现、自传播五个关键节点,分析不同节点之间的转化率,找到能够提升的环节,采取措施。

 

九、路径分析

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。

如何进行用户行为路径分析?

 

  1. 计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。

  2. 查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。

  3. 进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。

  4. 通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。

  5. 对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。

 

以上。



Tags:数据分析   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
自媒体运营 运营媒体数据分析怎么写
数据分析之旅自媒体运营工作充满挑战,但也令人陶醉。在此,我愿意与您分享我在该领域的八段独特体验及感悟。1.初入行业的激动与迷茫初识数据分析及自媒体运营领域,我心潮澎湃,对...【详细内容】
2024-01-26  Search: 数据分析  点击:(41)  评论:(0)  加入收藏
抖音万粉达人,是怎么做数据分析的?
在运营抖音账号的过程中,我们需要建立起对于抖音账号、短视频、直播等数据整体的认知,才能够对照实际数据去科学调整阶段性的运营目标,实现持续变现。那么知识达人该如何对抖音...【详细内容】
2024-01-15  Search: 数据分析  点击:(57)  评论:(0)  加入收藏
使用Python进行数据分析,需要哪些步骤?
Python是一门动态的、面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言。Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读一篇外语文章。Python这种特...【详细内容】
2024-01-15  Search: 数据分析  点击:(169)  评论:(0)  加入收藏
网站优化数据你分析过吗?做SEO优化离不开数据分析
作为一名网站管理员,你是否曾经感到困惑,为什么你的网站在搜索引擎中的排名总是不如人意?为什么你的网站流量总是无法突破某个瓶颈?其实,这些问题很可能是因为你忽略了网站优化数...【详细内容】
2024-01-01  Search: 数据分析  点击:(59)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19  Search: 数据分析  点击:(41)  评论:(0)  加入收藏
在Linux系统中实现容器化的大规模数据分析平台:Hadoop和Spark
在Linux系统中实现容器化的大规模数据分析平台,我们可以利用Hadoop和Spark这两个强大的开源工具。Hadoop是一个分布式计算框架,适用于处理大规模数据集。它提供了分布式文件系...【详细内容】
2023-12-15  Search: 数据分析  点击:(155)  评论:(0)  加入收藏
数据库优化:提升网站SEO数据分析能力的关键
摘要:在当今数字化时代,网站的SEO(搜索引擎优化)数据分析能力对于吸引流量和提升用户体验至关重要。而数据库优化作为一项关键的技术手段,能够显著提升网站的数据处理效率和分析...【详细内容】
2023-12-13  Search: 数据分析  点击:(121)  评论:(0)  加入收藏
高级数据分析师必备的八大能力
到底高级的数据分析师需要啥能力?这是很多人心中的疑惑。网上流行的都是Excel,SQL,Python,都是数据分析从0到1,那到底从1到100该弄些啥?陈老师给大家准备了一个《数据分析年底盘点...【详细内容】
2023-11-29  Search: 数据分析  点击:(64)  评论:(0)  加入收藏
Python:打造可视化数据分析应用的实战指南!
随着数据科学和人工智能的快速发展,数据分析变得越来越重要。在数据分析的过程中,可视化是一个非常关键的环节。它可以帮助我们更好地理解数据、发现规律和趋势。Python作为一...【详细内容】
2023-11-24  Search: 数据分析  点击:(231)  评论:(0)  加入收藏
聚类算法在大规模数据分析中的效果评估
在大规模数据分析中,聚类算法是一种常用的数据挖掘技术,用于将数据集划分为具有相似特征的群组。然而,对于大规模数据集,评估聚类算法的效果变得尤为重要。本文将探讨聚类算法在...【详细内容】
2023-11-21  Search: 数据分析  点击:(273)  评论:(0)  加入收藏
▌简易百科推荐
大数据杀熟何时告别“人人喊打却无可奈何”?
2月7日郑州飞往珠海的航班,不同手机、不同账号搜索该航班显示出不同价格。图源网络有网友近日分享在某平台的购票经历,引发社会广泛关注——用3个账号买同一航班同...【详细内容】
2024-01-30    中国青年网  Tags:大数据杀熟   点击:(33)  评论:(0)  加入收藏
简易百科:到底什么是大数据?
随着互联网的快速发展,大数据已经成为了当今社会最热门的话题之一。那么,到底什么是大数据呢?首先,我们需要明确大数据的定义。大数据是指数据量极大、类型繁多、处理难度高的数...【详细内容】
2024-01-30    简易百科  Tags:大数据   点击:(40)  评论:(0)  加入收藏
数据采集新篇章:AI与大模型的融合应用
开篇在AIGC(人工智能与通用计算)应用中,大型语言模型(LLM)占据着举足轻重的地位。这些模型,如GPT和BERT系列,通过处理和分析庞大的数据集,已经极大地推动了自然语言理解和生成的边界...【详细内容】
2024-01-17  崔皓  51CTO  Tags:数据采集   点击:(52)  评论:(0)  加入收藏
挑战 Spark 和 Flink?大数据技术栈的突围和战争
十年的轮回,正如大数据的发展一般,它既是一个轮回的结束,也是崭新的起点。大数据在过去的二十年中蓬勃发展,从无到有,崛起为最具爆炸性的技术领域之一,逐渐演变成为每个企业不可或...【详细内容】
2024-01-17  InfoQ    Tags:大数据   点击:(40)  评论:(0)  加入收藏
分布式存储系统在大数据处理中扮演着怎样的角色?
如果存储节点本身可以定制,则通常会让其支持部分计算能力,以利用数据的亲和性,将部分计算下推到相关的存储节点上。如果存储是云上的 S3 等对象存储,无法定制,则通常会将数据在计...【详细内容】
2023-12-19  木鸟杂记  微信公众号  Tags:大数据   点击:(48)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19    51CTO  Tags:大数据   点击:(41)  评论:(0)  加入收藏
利用生成对抗网络进行匿名化数据处理
在互联网时代,数据日益成为人们的生产资料。然而,在某些情况下,我们需要分享数据,但又需要保护个人隐私。这时,匿名化技术就显得尤为重要。本文将介绍利用生成对抗网络进行匿名化...【详细内容】
2023-12-18  技巧达人小影    Tags:数据处理   点击:(57)  评论:(0)  加入收藏
盘点那些常见的数据中心类型,你知道几个?
在数字化潮流的浪潮下,数据中心如同企业的神经系统,关系到业务的稳健运转。而在这个巨大的网络中,各种数据中心类型如雨后春笋般崭露头角。从企业级的个性至云数据中心的虚拟化...【详细内容】
2023-12-07  数据中心之家  微信公众号  Tags:数据中心   点击:(66)  评论:(0)  加入收藏
数据中心的七个关键特征
随着信息技术的不断演进,数据中心的可靠性、可扩展性、高效性、安全性、灵活性、管理性和可持续性成为业界探讨的焦点。下面让我们一同深入剖析这些关键特征,了解它们是如何影...【详细内容】
2023-12-06  数据中心之家  微信公众号  Tags:数据   点击:(63)  评论:(0)  加入收藏
什么是数据解析?将数据转化为更好的决策
什么是数据解析?数据解析是一门专注于从数据中获取洞察力的学科。它包含数据分析(data analysis)和管理的流程、工具和技术,包括数据的收集、组织和存储。数据解析的主要目的是...【详细内容】
2023-12-06  计算机世界    Tags:数据解析   点击:(63)  评论:(0)  加入收藏
站内最新
站内热门
站内头条