您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Python

Python数据分析实战,小费数据集应用

时间:2020-08-17 11:19:56  来源:  作者:

一、数据来源

本节选用的是Python的第三方库seaborn自带的数据集,该小费数据集为餐饮行业收集的数据,其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾客是否吸烟、day为消费的星期、time为聚餐的时间段、size为聚餐人数。

import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns    #导入seaborn库
tips=sns.load_dataset('tips')  #seaborn库自带的数据集
tips.head()
Python数据分析实战,小费数据集应用

 

二、问题探索

一、小费金额与消费总金额是否存在相关性?

二、性别、是否吸烟、星期几、聚餐人数和小费金额是否有一定的关联?

三、小费金额占小费总金额的百分比是否服从正态分布?

三、数据清洗

tips.shape #数据集的维度

(244,7)

共有244条数据,7列。

tips.describe() #描述统计
Python数据分析实战,小费数据集应用

 

描述统计结果如上所示。

tips.info() #查看缺失值信息
Python数据分析实战,小费数据集应用

 

此例无缺失值。

四、数据探索

tips.plot(kind='scatter',x='total_bill',y='tip') #绘制散点图
Python数据分析实战,小费数据集应用

 

由图可看出,小费金额与消费总金额存在正相关性。

import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns   #导入seaborn库
tips=sns.load_dataset('tips')#seaborn库自带的数据集
tips.head()

3.0896178343949052

female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消费金额female_tip

2.833448275862069

s = Series([male_tip,female_tip],index=['male','female'])
s

male 3.089618

female 2.833448

dtype: float64

s.plot(kind='bar') #男女平均小费柱状图
Python数据分析实战,小费数据集应用

 

由图可看出,女性小费金额小于男性小费金额。

tips['day'].unique() #日期的唯一值 

[Sun, Sat, Thur, Fri]

Categories (4, object): [Sun, Sat, Thur, Fri]

sun_tip = tips[tips['day'] == 'Sun']['tip'].mean()
sat_tip = tips[tips['day'] == 'Sat']['tip'].mean()
thur_tip = tips[tips['day'] == 'Thur']['tip'].mean()
fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各个日期的平均小费值
s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun'])
s

 

Python数据分析实战,小费数据集应用

 

s.plot(kind='bar') #日期平均小费柱状图
Python数据分析实战,小费数据集应用

 

由图可看出,周六、周日的小费比周四、周五的小费高。

tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip'])
tips.head(10) #小费所占百分比
Python数据分析实战,小费数据集应用

 

tips['percent_tip'].hist(bins=50)#小费百分比直方图
Python数据分析实战,小费数据集应用

 

由图可看出,小费金额占小费总金额的百分比基本服从正态分布。



Tags:Python数据分析   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
前言数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程,是数据科学领域的核心技能。本篇文章有点...【详细内容】
2021-04-01  Tags: Python数据分析  点击:(301)  评论:(0)  加入收藏
一、数据来源本节选用的是Python的第三方库seaborn自带的数据集,该小费数据集为餐饮行业收集的数据,其中total_bill为消费总金额、tip为小费金额、sex为顾客性别、smoker为顾...【详细内容】
2020-08-17  Tags: Python数据分析  点击:(43)  评论:(0)  加入收藏
一、数据可视化概述数据可视化是在整个数据分析非常重要的一个辅助工具,可以清晰的理解数据,从而调整我们的分析方法。- 能将数据进行可视化,更直观的呈现- 使数据更加客观、...【详细内容】
2020-08-11  Tags: Python数据分析  点击:(57)  评论:(0)  加入收藏
本文的主要学习目标: 熟练的掌握 numpy 数组相关的运算; 熟练的使用 numpy 创建矩阵; 理解矩阵转置和乘法; 熟练的计算数据的相关系数、方差、协方差、标准差; 理解并能够计算特...【详细内容】
2020-08-11  Tags: Python数据分析  点击:(48)  评论:(0)  加入收藏
数据清洗 (data cleaning) 是机器学习和深度学习进入算法步前的一项重要任务,我平时比较习惯使用的 7 个步骤,总结如下: Step1 : read csv Step2 : preview data Step3: check...【详细内容】
2020-08-07  Tags: Python数据分析  点击:(54)  评论:(0)  加入收藏
前言使用Python进行数据分析是一件专业领域的事情,所以要想强化数据分析的技能,需要大家不断练习。同时,我们也需要向有经验的数据分析师学习他们的专业技巧。这篇文章我们介绍...【详细内容】
2020-07-26  Tags: Python数据分析  点击:(41)  评论:(0)  加入收藏
数据分析肯定需要数据,这个数据一般都是来自实际学习工作业务中的,比如学校的学生成绩,淘宝京东的销售数据,视频网站不同种类的视频播放点击量等。自己练习的话,除了可以去一些公...【详细内容】
2020-07-13  Tags: Python数据分析  点击:(70)  评论:(0)  加入收藏
来源:Python爱好者社区ID:python_shequ作者:深度沉迷学习 Python语言:简要概括一下Python语言在数据分析、挖掘场景中常用特性: 列表(可以被修改),元组(不可以被修改) 字典(<k,v>结构...【详细内容】
2019-09-25  Tags: Python数据分析  点击:(103)  评论:(0)  加入收藏
▌简易百科推荐
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】
2021-12-27  IT资料库    Tags:Python 库   点击:(1)  评论:(0)  加入收藏
菜单驱动程序简介菜单驱动程序是通过显示选项列表从用户那里获取输入并允许用户从选项列表中选择输入的程序。菜单驱动程序的一个简单示例是 ATM(自动取款机)。在交易的情况下...【详细内容】
2021-12-27  子冉爱python    Tags:Python   点击:(4)  评论:(0)  加入收藏
有不少同学学完Python后仍然很难将其灵活运用。我整理15个Python入门的小程序。在实践中应用Python会有事半功倍的效果。01 实现二元二次函数实现数学里的二元二次函数:f(x,...【详细内容】
2021-12-22  程序汪小成    Tags:Python入门   点击:(32)  评论:(0)  加入收藏
Verilog是由一个个module组成的,下面是其中一个module在网表中的样子,我只需要提取module名字、实例化关系。module rst_filter ( ...); 端口声明... wire定义......【详细内容】
2021-12-22  编程啊青    Tags:Verilog   点击:(7)  评论:(0)  加入收藏
运行环境 如何从 MP4 视频中提取帧 将帧变成 GIF 创建 MP4 到 GIF GUI ...【详细内容】
2021-12-22  修道猿    Tags:Python   点击:(5)  评论:(0)  加入收藏
面向对象:Object Oriented Programming,简称OOP,即面向对象程序设计。类(Class)和对象(Object)类是用来描述具有相同属性和方法对象的集合。对象是类的具体实例。比如,学生都有...【详细内容】
2021-12-22  我头秃了    Tags:python   点击:(9)  评论:(0)  加入收藏
所谓内置函数,就是Python提供的, 可以直接拿来直接用的函数,比如大家熟悉的print,range、input等,也有不是很熟,但是很重要的,如enumerate、zip、join等,Python内置的这些函数非常...【详细内容】
2021-12-21  程序员小新ds    Tags:python初   点击:(5)  评论:(0)  加入收藏
Hi,大家好。我们在接口自动化测试项目中,有时候需要一些加密。今天给大伙介绍Python实现各种 加密 ,接口加解密再也不愁。目录一、项目加解密需求分析六、Python加密库PyCrypto...【详细内容】
2021-12-21  Python可乐    Tags:Python   点击:(7)  评论:(0)  加入收藏
借助pyautogui库,我们可以轻松地控制鼠标、键盘以及进行图像识别,实现自动抢课的功能1.准备工作我们在仓库里提供了2个必须的文件,包括: auto_get_lesson_pic_recognize.py:脚本...【详细内容】
2021-12-17  程序员道道    Tags:python   点击:(13)  评论:(0)  加入收藏
前言越来越多开发者表示,自从用了Python/Pandas,Excel都没有打开过了,用Python来处理与可视化表格就是四个字&mdash;&mdash;非常快速!下面我来举几个明显的例子1.删除重复行和空...【详细内容】
2021-12-16  查理不是猹    Tags:Python   点击:(20)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条