您当前的位置:首页 > 互联网百科 > 大数据

使用Python可视化图表分析行程数据

时间:2021-10-11 09:24:55  来源:  作者:杨建荣的学习笔记

最近一直在想怎么分析一下个人的行程数据,看看能够从行程数据里面分析出点什么来。最开始我的期望还是蛮高的,有如下的一些预期:

 

  • 根据出行时间范围,可以基本确定他的生活节奏,工作强度

  • 能够通过行程时间范围来猜测汽车尾号

  • 根据出行的耗时历史来建议出行时间

 

如果能够分析得到这些信息,感觉还是蛮有意思的,于是开始自己动手,第一个问题就是数据源,导航软件目前还不提供行程数据的导出,所以我是把7-8两个月的行程数据逐个照着导航行程整理出来了,大体的数据情况还可以,不过其中有些数据做了额外处理,比如时间的处理,因为是如果是7:15,那么按照数字化显示就不能是7.15,而更合理的显示是7.4,还有行程时间,比如1:30,是需要统一按照分钟90分钟来整合的,整理后得到的数据如下:

使用Python可视化图表分析行程数据

首先我按照时间做了对行程的耗时做了分析,结果发现这个数据似乎不大理想,本来预期是比较稳定的,还打算按照这个数据做下预测。

使用Python可视化图表分析行程数据

这种情况下就得换一个思路了,先看看数据的整体分布,使用条形图其实是不好体现数据的分布情况,因为有些行程之间是没有直接关联的,比如早上和晚上的行程,因为时间的差异,条形图的模式反而会有很大的抖动。

如下是按照行程的耗时分布图:

使用Python可视化图表分析行程数据

如下是行程出发时间的分布情况,基本上来说都是在6:30~7:00之间开始出发,晚上基本在20:00左右返程。

使用Python可视化图表分析行程数据

如下是按照周一到周日的行程耗时分布,可以明显看到周二的行程分布要少很多,还不如周六,周日的多,所以从这一点是可以猜出来很可能是因为限号。

使用Python可视化图表分析行程数据

当然前面提到了两个指标,一个是行程耗时,一个是出发时间,还有一个是路程,因为路程和耗时两者是有一定关联,但是折算下来一个折中的指标就是平均速度。所以按照平均速度的分布情况来看,周一和周五是最堵的,相对周四和周六是最通畅的。

使用Python可视化图表分析行程数据

我们区别于一般的可视化,引入箱线图,可以看到平均行程的耗时在45分钟左右,区间基本在30-60分钟之间。

使用Python可视化图表分析行程数据

其实数据分析到了这里,还是有很大差异的,虽然或多或少的分析出来了一些内容,但是有些指标还是没有充分使用到,而且显示的指标情况还是不够清晰,所以打算使用seaborn进一步做下调整。

如下是行程距离,行程耗时和星期数的综合分布图。

使用Python可视化图表分析行程数据

如下是星期和行程耗时的分布图,相比之前的分布图来说会更加清晰一些。

使用Python可视化图表分析行程数据

我们继续引入平均速度,出发时间和星期数进行关联,可以看到整个行程会有明显的分水岭,早间和晚间基本堵是工作日,而其他的时间基本都是周末。

使用Python可视化图表分析行程数据

而要进一步探索这些数据指标间的关联,就需要引入略复杂的图PairGrid,可以把多个指标都放入,可以生成多个维度的分布图。

使用Python可视化图表分析行程数据

接下来需要对数据的指标情况进一步分析,引入检验和预测的功能。



Tags:数据   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
本篇文章主要介绍了使用MyBatis框架完成数据库的增、删、改、查操作。准备工作运行schema.sql和data.sql脚本文件中的 SQL 语句创建t_user表并添加部分测试数据。schema.sql...【详细内容】
2022-07-15  Tags: 数据  点击:(0)  评论:(0)  加入收藏
mysql中的my.ini路径在哪里mysql中“my.ini”文件:1、linux系统中,该文件的位置是“/etc/mysql/my.cnf”;2、windows系统中,该文件的位置是“C:\Program Files\MySQL\MySQL Serv...【详细内容】
2022-07-15  Tags: 数据  点击:(1)  评论:(0)  加入收藏
今天给大家讲讲 SpringBoot 框架 整合 Elasticsearch 实现海量级数据搜索。一、简介在上篇ElasticSearch 文章中,我们详细的介绍了 ElasticSearch 的各种 api 使用。实际的项...【详细内容】
2022-07-15  Tags: 数据  点击:(3)  评论:(0)  加入收藏
一、Zookeeper概述与安装Zookeeper概述与安装请参考我之前的文章:分布式开源协调服务——ZookeeperZookeeper的安装方式有两种,两种方式都会讲,其实大致配置都是一样...【详细内容】
2022-07-15  Tags: 数据  点击:(0)  评论:(0)  加入收藏
俗话说,天下大势,合久必分、分久必合。数据库领域同样如此。过去五十余年,数据库经历OLTP和OLAP两种需求漫长的融合-分离-再融合的过程。究其原因,数据库的发展始终与用户场景需...【详细内容】
2022-07-14  Tags: 数据  点击:(4)  评论:(0)  加入收藏
当我们的旧电脑使用了七八年甚至更久,就会出现一系列的毛病,比如卡顿、死机、蓝屏、黑屏等等,这让我们使用时的体验感非常不好,我们可能就会考虑到更换一台新电脑,这样就可以将旧...【详细内容】
2022-07-13  Tags: 数据  点击:(9)  评论:(0)  加入收藏
创建数据表1、 基本语法莆田IT外包|服务器虚拟化|数据存储|数据备份|网络故障排除|数据恢复 www.xiaolin.cc需要注意:表需要放在对应的数据库下面,IT外包 服务器虚拟化 数据存...【详细内容】
2022-07-13  Tags: 数据  点击:(6)  评论:(0)  加入收藏
大数据在商业中的作用日趋凸显,数据驱动已经成为企业发展的核心竞争力。然而,在日常工作中,数据团队常常是业务部门的工具人,需要数据的时候向数据团队提个需求,但业务究竟是如何...【详细内容】
2022-07-12  Tags: 数据  点击:(6)  评论:(0)  加入收藏
Javascript无法直接访问SqlServer数据库的,但可以使用浏览器的“执行SQL”功能查询数据库,将查询结果保存在浏览器变量中,然后在Javascript代码中引用这些变量即可。在浏览器的...【详细内容】
2022-07-11  Tags: 数据  点击:(11)  评论:(0)  加入收藏
在我们平时进行数据挖掘建模时,一般首先得对数据进行预处理,其中常用的方法包括缺失值处理、共线性处理、异常值处理、数据标准化、数据归一化等。缺失值处理有时样本的数据...【详细内容】
2022-07-11  Tags: 数据  点击:(8)  评论:(0)  加入收藏
▌简易百科推荐
一、Zookeeper概述与安装Zookeeper概述与安装请参考我之前的文章:分布式开源协调服务——ZookeeperZookeeper的安装方式有两种,两种方式都会讲,其实大致配置都是一样...【详细内容】
2022-07-15  大数据老司机    Tags:Zookeeper   点击:(0)  评论:(0)  加入收藏
大数据在商业中的作用日趋凸显,数据驱动已经成为企业发展的核心竞争力。然而,在日常工作中,数据团队常常是业务部门的工具人,需要数据的时候向数据团队提个需求,但业务究竟是如何...【详细内容】
2022-07-12  大数据推荐杂谈    Tags:大数据   点击:(6)  评论:(0)  加入收藏
在我们平时进行数据挖掘建模时,一般首先得对数据进行预处理,其中常用的方法包括缺失值处理、共线性处理、异常值处理、数据标准化、数据归一化等。缺失值处理有时样本的数据...【详细内容】
2022-07-11  微说互联网    Tags:大数据   点击:(8)  评论:(0)  加入收藏
作者: 俊欣来源:关于数据分析与可视化今天小编来为大家安利另外一个用于绘制可视化图表的Python框架,名叫Dash,建立在Flask、Plotly.js以及React.js的基础之上,在创建之出的目的...【详细内容】
2022-06-22  CDA数据分析师    Tags:可视化框架   点击:(37)  评论:(0)  加入收藏
最近可视化互动平台,新增支持了SVG path底图,可以用来灵活地创造出非常炫酷的可视化大屏,让数据与图例之间产生更符合更直观的关联。SVG底图大大加强了数据图表的表现力。下面...【详细内容】
2022-06-22  迪赛智慧数    Tags:数据可视化   点击:(28)  评论:(0)  加入收藏
数据出境主要指在中国境内的数据处理者通过网络及其他方式(如物理携带),将其在中国境内运营中收集和产生的数据,通过直接提供或开展业务、提供服务和产品等方式提供给境外组织或...【详细内容】
2022-06-16    人民邮电报  Tags:数据出境   点击:(21)  评论:(0)  加入收藏
一、Minio介绍1.1 Minio简介MinIO 是高性能的对象存储,是为海量数据存储、人工智能、大数据分析而设计的,它完全兼容Amazon S3接口,单个对象最大可达5TB,适合存储海量图片、视频...【详细内容】
2022-06-13  wljslmz    Tags:Minio   点击:(449)  评论:(0)  加入收藏
“小王,你把这些用户数据分析下,分别打个价值标签给我,我们制定一下618的营销活动。”这时候你拿着用户数据一脸懵?打标签?从哪几个维度?脑海里仿佛有很多想法,但又不知道从何做起...【详细内容】
2022-05-30  数据分析不是个事儿    Tags:数据分析   点击:(1)  评论:(0)  加入收藏
以下文章来源于数仓宝贝库 ,作者Saurabh业务问题的范围太广、太深、太复杂,一种工具无法解决所有问题,在大数据和分析领域尤其如此。热数据需要在内存中存储和处理,因此适合用缓...【详细内容】
2022-05-24  数据分析不是个事儿    Tags:数据存储   点击:(81)  评论:(0)  加入收藏
导读:工业物联网感知层作为物理世界与数字世界的桥梁,是数据的第一入口。现实情况下,由于感知层数据来源非常多样,来自各种多源异构设备和系统,因此如何从这些设备和系统中获取数...【详细内容】
2022-05-24  华章科技    Tags:数据采集   点击:(61)  评论:(0)  加入收藏
站内最新
站内热门
站内头条