文|花随花心
无论是刚入门的数据分析小白,但是工作多年的数据工程师,学会用Excel做数据分析总是第一门课。其实excel不只是一个数据统计工具,它的数据分析能力十分强大,除了基本的数据计算之外,还可以进行数据清洗、数据可视化等等,财务人、业务人等都很喜欢用excel做报表。
虽然Excel不能实现大数据量的数据分析,对于数据分析领域的新手来说,它成为一个很好的跳板,帮助你快速掌握数据分析的基础思维和方法。
下面我就以某电器商家的淘宝数据为例,详细介绍一下如何用excel分析数据!
这是一家卖电器的店铺后台的订单数据,来源于已卖出的宝贝。隐私数据都被我删除了,无论从手机号码、家庭地址,还是会员名,真实姓名,统统去除。
这里可以分享一个小函数:Replace()。如果需要隐藏一部分文本,可以使用这个函数,正如数据源当中的“买家会员名”,我把前3个文本都用“*”来代替,既不会影响这个字段的使用,又可以合理隐藏真实信息。
而我们做电商数据分析,一定要记住,是先分析,后数据。除非刚入门的时候,不知道分析什么好,所以看到有什么数据就从数据当中去提取有价值的信息。
但真正的高手,都是先分析后数据,先胜而后战。而分析靠的是什么,其实就是运营经验,归根到底做电商数据分析,不懂电商的业务逻辑,分析出来的信息,是不适合用来做商业决策的。因为信息是错误的,那么决策的成本机会增加。
往往一条有重要指导意义的错误信息,会导致一家店铺,一家公司走向死亡。所以,没把握之前,就要做微调型决策,一步一步向前走。
既然有“买家会员名”这个字段,那么能否知道,有多少买家在过去一段时间进行了二次复购呢,甚至多次复购呢?
分析这个问题的时候,要注意,什么是复购?
复购,就是说一个客户在过去一段时间有来店铺买过两次以上的产品,也就是下过两次订单。由于订单也有可能是一个客户在同一时间拍下2个产品,每个产品1个订单,那为了方便统计,我们也默认这算是复购。
而由于数据源是取决于不同的下单日期的,如果我取的日期是最近一周,那么很有可能是没有任何复购的可能性。这个要看这个类目的产品,重复购买的周期有多久,这个一定有行业均值,而如果不知道,凭借自己的行业经验也是可以的。
为了回答这个问题,我对数据源进行了处理,处理结果如下。
借助了PowerPivot的度量值计算,分别统计有多少的“买家会员名”,以及去重之后,还剩下多少数,两者相减,剩下来的就是“复购会员数”,然后基于度量值计算,去分析复购率。
很明显,如果我以省份作为分析维度的话,那么上面这份数据透视表就可以看出不同的省份下哪些复购率高。
如果从这段时间整家店铺来算,整体复购率是16.30%,而如果细化到各个省份,每个省份都有各自的复购率计算,比如广东省,复购率16.56%,和整体复购率持平。
通过“复购会员数”最起码知道哪些人重复购买的次数有多少,数值是2,代表买过3次,其中有2次是复购;数值是10,代表买过11次,其中有10次是复购。
复购次数多,不见得消费的金额就高,所以要看其总金额,看为这家店铺贡献了多少人民币。那么从数据分析的角度来说,到这里为止,能给的决策其实就是围绕这些高复购率的省份,高复购率的会员进行重点维护。
毕竟,现在一次性生意是越来越难做的,要做就要做可以二次复购甚至多次复购的生意。
这里,就不得不提到日历表,我们接下来结合日历表,进行日期维度数据的提取。有了日期数据,才能计算环比同比的订单增长率。
为了回答这个问题,我对数据源进行了处理,处理结果如下。
通过计算订单的环比、同比数据,可以快速了解店铺订单增长率走势如何。
如果纯粹靠Excel的函数嵌套来计算同比环比的话,那么无论是从手工效率,还是数据计算正确率来说,都会大打折扣。而如果借助PowerPivot的关于同比环比计算的DAX函数,那么就可以快速实现分析。
这个方法可以分析订单增长率,难不成就不能分析客户增长率吗?当然可以,这里就不一一演示。
由于我的数据源这边只有2019年7月和8月的订单数据,所以我们只针对这2个月的数据进行分析。
假设之前制定今年的7月份销售额指标要达到10万,8月份要20万,这时候如何通过自动化的方式来分析这个任务额完成度?所谓完成度,就是用实际销售额比销售额指标,要的就是看是否能达标。
接下来基于这份任务表,结合我们之前做的订单分析模型,来对数据源进行处理。
为了回答这个问题,我对数据源进行了处理,处理结果如下。
这样子,只需要选择年份数据,就可以快速分析出每一年的实际订单任务额完成度是多少,超过90%,就算达标。
那么,这里给每个月份指定的任务额是固定的吗?其实我们只需要修改一下数字,刷新之后,这些数据都会自动变化,自动计算。
而它计算的背后,是有一个数据模型在控制的,这个也不是Excel的函数嵌套能办到的事情。