接了一个需求,产品想分析一下用户增长的曲线。也就是某个时间段的每日总人数列表。好对近期活动进行一个效果的评测。这个统计sql还是花了我一小段时间的。MySQL统计这个还是需要一定的技巧的。
需求分析
假如上表为user_info,我们很容易根据时间维度统计出每日新增的人数。sql如下:
select reg_time, count(user_id) daily_quantity from user_info group by reg_time
通过上面的sql我们很容易得出以下列表:
但是这个并不是我们想要的结果。我们想要的应该是 上一天的总人数加上今天的净增长数,以此类推。下面才是我们想要的结果:
这就有点棘手了,我们需要进行累加计算。我尝试了自链接,函数等一些操作后还是没有得到一个正确的结果。这时想到如果是JAVA代码处理这个就再合适不过了,我们只要声明初始值,然后循环累加就能计算出结果了:
public static void main(String[] args) { int[] arr = {1, 2, 2, 1}; int[] ints = dailyQuantityArr(0, arr); for (int i : ints) { System.out.println("i = " + i); } } public static int[] dailyQuantityArr(int base, int[] dailyIncrQuantity) { int[] result = new int[dailyIncrQuantity.length]; // 累加填充 for (int i = 0; i < dailyIncrQuantity.length; i++) { base += dailyIncrQuantity[i]; result[i] = base; } return result; }
上面的伪代码就可以计算出结果。当然如果可以的话尽量在java业务代码进行这种复杂运算。但是产品给出的需求是我们能够提供一句sql能够直接在可视化数据引擎中得出他要的答案。于是从上面的代码得出灵感。
mysql是否有这种变量呢?有!当然有。记得很普遍的场景,以前经常有业务需要我们输出序号,Oracle是自带一个伪列rownum,但是mysql没有。mysql通常通过声明自增变量来生成序号。拿user_info表举例子:
select (@i:=@i+1) as rownum, user_id from user_info ,(select @i:=0) as r
Mysql 用户变量
mysql 变量分为 局部变量、用户变量、会话变量、全局变量 。上面的语句我们使用的是用户变量。用户变量与数据库连接有关,在连接中声明的变量,在存储过程中创建了用户变量后一直到数据库实例接断开的时候,变量就会消失。在此连接中声明的变量无法在另一连接中使用。
MySQL中用户变量不用事前申明,使用的时候以@varname的格式进行声明。通过 := 或者 = 进行赋值操作。如果需要对外输出需要用 select 关键字,而且赋值必须使用 := 符号。
Mysql累加计算
我们学习了用户变量后就知道如何进行累加计算了,那么user_info表的日累计总人数应该是这样的:
select a.reg_time, a.daily, @i:=@i+a.daily as daily_quantity from (select reg_time ,count(user_id) daily from user group by reg_time ) a ,(select @i:=0) b
查询的结果如下,符合逻辑需要。
但是这里有一个小坑,在实际业务中`@i`初始化的时候有可能不为0,比如我们统计上面9月4号到9月6号这时候之前的总人数为1 。这个要特别注意。实际业务开发中如果我们能在逻辑编码中实现还是建议在逻辑编码中进行一些复杂的运算。
总结
今天我们通过mysql用户变量解决了一个在sql中累加计算的问题。