焦点　股票　程序开发　站长技术　抖音　安卓　电商　 iphone　微信　理财　职场　美食　　

简易百科手机版

您当前的位置：首页 > 电脑百科 > 程序开发 > 语言 > Python

Python数据分析——处理中国地区信息

时间：2021-12-29 11:50:45 来源：作者：Python不秃头

数据的爬取

代码：

import pandas as pd

data=pd.read_csv("example_data.csv",header=1)

print(data)

data1=pd.read_csv("北京地区信息.csv",header=1,encoding='gbk')

data2=pd.read_csv("天津地区信息.csv",encoding='gbk')

print(data1)

print(data2)

代码运行结果：

Python数据分析——处理中国地区信息

首先使用pandas的read_csv()方法进行数据的读取，然后就能够看到相应的表格信息。

检查重复数据

# 2.2检查重复数据

dupnum=data.duplicated()

print(dupnum)

# 对重复值进行处理

caldup=data.drop_duplicates()

print(caldup)

代码运行结果：

Python数据分析——处理中国地区信息

主要是是使用这个duplicated()方法进行数据的查重，返回一个布尔序列，仅对唯一元素而言为True。如果有重复的数据就会在该数值的部分返货Flase。

然后我们就可以使用drop_duplicates()进行重复值删除。

检查缺失值

代码：

from pandas import Series

from numpy import NAN

# import pandas as pd 

series_obj=Series([1,None])

pd.notnull(series_obj)

# 上面做的是测试

pd.notnull(data)

pd.notnull(data1)

pd.notnull(data2)

代码运行结果：

Python数据分析——处理中国地区信息

使用pd.notnull(data1)进行非空数值的返回，返回值是布尔型的矩阵，再取df[布尔型矩阵]返回的是id为非空的行。

检查异常值

import numpy as np

# 2.4 检查异常值

def three_sig(ser1):

  mean_value=ser1.mean()

#   标准差

  std_value=ser1.std()

#   位于3σ范围外的都是异常值

# 数值大于u+3σ小雨u-3σ

  rule=(mean_value-3*std_value>ser1)|(ser1.mean()+3*ser1.std()<ser1)

  index=np.arange(ser1.shape[0])[rule]

  outrange=ser1.iloc[index]

  return outrange

three_sig(data2["女性"])

代码运行结果：

Python数据分析——处理中国地区信息

Python数据分析——处理中国地区信息

3σ原则又称为拉依达准则，该准则具体来说，就是先假设一组检测数据只含有随机误差，对原始数据进行计算处理得到标准差，然后按一定的概率确定一个区间，认为误差超过这个区间的就属于异常值。

通俗理解就是正态分布。

Tags：数据分析点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

数据分析中常用的8种模型你都知道吗？98%的人都需要

“小王，你把这些用户数据分析下，分别打个价值标签给我，我们制定一下618的营销活动。”这时候你拿着用户数据一脸懵？打标签？从哪几个维度？脑海里仿佛有很多想法，但又不知道从何做起...【详细内容】

2022-05-30　　Tags: 数据分析点击:(1)　　评论:(0)　　加入收藏

Python数据分析学习三步曲

Python是非常接近人类语言的一门计算机语言，简单易懂的语法，可以让我们更好的理解，还有强大的第三方库，程序编辑的效率也可以大幅度提高。《关于全面开展中小学生人工智能教育...【详细内容】

2022-05-25　　Tags: 数据分析点击:(52)　　评论:(0)　　加入收藏

企业做数据分析的目的是什么？

本文作者 | 经韬纬略智库全文 4586 字数据是数字化的证据——没有记录下来的事情就没有发生过追溯——追责、求根源、求真相监控——监...【详细内容】

2022-05-06　　Tags: 数据分析点击:(67)　　评论:(0)　　加入收藏

DT时代，如何成为一名合格的电商数据分析师？

又是一年春招季，你最近有为找工作或换工作而犯愁吗？现在已经进入春招的“金三银四”决赛圈了，再不好好准备真的是黄花菜都要凉了。那么如何才能在“岗少人多”、“僧多粥少”的...【详细内容】

2022-04-13　　Tags: 数据分析点击:(50)　　评论:(0)　　加入收藏

必须学会的Python数据分析利器

大家好，我是老班~很多读者问过我，文章中的Python代码都是用的什么编辑器写的？今天就公开啦：Jupyter Notebook，没有Pycharm，没有Vscode，没有Sublime text。只有一款工具：Jupyter Note...【详细内容】

2022-04-12　　Tags: 数据分析点击:(76)　　评论:(0)　　加入收藏

实战经验：大数据分析为什么大多数会失败？

本帖由东南亚最大的超级应用程序之一Gojek的商业智能BI前高级副总裁Crystal撰写。以下是摘要，原文点击标题：Gojek成为东南亚最大的消费交易技术集团，其超级app应用包括订购食...【详细内容】

2022-02-14　　Tags: 数据分析点击:(81)　　评论:(0)　　加入收藏

数据分析师软件安装必备，SQL Server软件安装手册

关系型数据库是目前最受欢迎的数据库管理系统，技术比较成熟，常见的关系型数据库有mysql 、SQL Server、Oracle、Sybase、DB2等。SQL Server 是Microsoft 公司推出的关系型数据...【详细内容】

2022-02-09　　Tags: 数据分析点击:(73)　　评论:(0)　　加入收藏

一图说清：做数据分析，到底要懂多少业务知识？

小伙们经常听到这样一句话：“数据分析师一定要懂业务！”那到底啥玩意才是业务？懂多少才算懂业务？今天跟大家分享一下。一、什么是业务？业务是相对于技术和行政来说的，是企业里一种...【详细内容】

2022-01-07　　Tags: 数据分析点击:(74)　　评论:(0)　　加入收藏

Python数据分析——处理中国地区信息

数据的爬取代码：import pandas as pddata=pd.read_csv("example_data.csv",header=1)print(data)data1=pd.read_csv("北京地区信息.csv",header=1,encoding='gbk')da...【详细内容】

2021-12-29　　Tags: 数据分析点击:(136)　　评论:(0)　　加入收藏

大数据时代，我们应该拥有怎样的数据分析思维？

1、什么是数据分析结合分析工具，运用数据分析思维，分析庞杂数据信息，为业务赋能。 2、数据分析师工作的核心流程：（1）界定问题：明确具体问题是什么；●what 发生了什么（是什么）●why 为...【详细内容】

2021-12-01　　Tags: 数据分析点击:(128)　　评论:(0)　　加入收藏

▌简易百科推荐

什么是Web3.0，与当下Web有什么区别，在未来真的能实现吗？

近几年 Web3 被炒得火热，但是大部分人可能还不清楚什么是 Web3，今天就让w3cschool编程狮小师妹带你了解下 Web3 是什么？与我们熟知的 Web1 和 Web2 又有什么区别呢？web3.0什么是...【详细内容】

2022-07-15　　编程狮W3Cschool　　　　Tags:Web3.0 　点击:(2)　　评论:(0)　　加入收藏

手机Python编程神器——AidLearning

1、让我们一起来看下吧，直接上图。第一眼看到是不是觉得很高逼格，暗黑画风，这很大佬。其实它就是------AidLearning。一个运行在安卓平台的linux系统，而且还包含了许多非常强大...【详细内容】

2022-07-15　　IT智能化专栏　　　　Tags:AidLearning 　点击:(2)　　评论:(0)　　加入收藏

基于Python+vue的自动化运维、完全开源的云管理平台

真正的大师,永远都怀着一颗学徒的心！一、项目简介今天说的这个软件是一款基于Python+vue的自动化运维、完全开源的云管理平台。二、实现功能基于RBAC权限系统录像回放 ...【详细内容】

2022-07-14　　菜鸟程序猿　　　　Tags:Python 　点击:(3)　　评论:(0)　　加入收藏

python接口自动化之MySQL数据连接

前言今天笔者想和大家来聊聊python接口自动化的MySQL数据连接，废话不多说咱们直接进入主题吧。一、什么是 PyMySQL？PyMySQL是在Python3.x版本中用于连接MySQL服务器的一个库，P...【详细内容】

2022-07-11　　测试架构师百里　　　　Tags:python 　点击:(19)　　评论:(0)　　加入收藏

Python异步之aiohttp

aiohttp什么是 aiohttp？一个异步的 HTTP 客户端\服务端框架，基于 asyncio 的异步模块。可用于实现异步爬虫，更快于 requests 的同步爬虫。安装pip install aiohttpaiohttp 和 r...【详细内容】

2022-07-11　　VT漫步　　　　Tags:aiohttp 　点击:(15)　　评论:(0)　　加入收藏

Python Queue 进阶用法

今天我们学习下 Queue 的进阶用法。生产者消费者模型在并发编程中，比如爬虫，有的线程负责爬取数据，有的线程负责对爬取到的数据做处理（清洗、分类和入库）。假如他们是直接交互的，...【详细内容】

2022-07-06　　VT漫步　　　　Tags:Python Queue 　点击:(34)　　评论:(0)　　加入收藏

python四大特性（封装，继承，重写，多态）

继承：是面向对象编程最重要的特性之一，例如，我们每个人都从祖辈和父母那里继承了一些体貌特征，但每个人却又不同于父母，有自己独有的一些特性。在面向对象中被继承的类是父类或基...【详细内容】

2022-07-06　　至尊小狸子　　　　Tags:python 　点击:(25)　　评论:(0)　　加入收藏

Python自动化之Python输出函数

点击上方头像关注我，每周上午 09:00准时推送，每月不定期赠送技术书籍。本文1553字，阅读约需4分钟 Hi，大家好，我是CoCo。在上一篇Python自动化测试系列文章：Python自动化测试之P...【详细内容】

2022-07-05　　CoCo的软件测试小栈　　　　Tags:Python 　点击:(27)　　评论:(0)　　加入收藏

Python request使用方法及问题总结

第一种方式：res = requests.get(url, params=data, headers = headers)第二种方式：res = requests.get(url, data=data, headers = headers)注意:1.url格式入参只支持第一种方...【详细内容】

2022-07-05　　独钓寒江雪之IT　　　　Tags:Python request 　点击:(19)　　评论:(0)　　加入收藏

用通俗易懂的多态世界观实例：理解python类的多态

什么是python类的多态python的多态，可以为不同的类实例，或者说不同的数据处理方式，提供统一的接口。用比喻的方式理解python类的多态比如，同一个苹果（统一的接口）在孩子的眼里（类实...【详细内容】

2022-07-04　　写小说的程序员　　　　Tags:python类　点击:(28)　　评论:(0)　　加入收藏

推荐资讯

一文搞懂响应式编程	Android开发组件化与
最流行的 .NET 反编译	MyBatis源码解读 \| 使
mysql数据库中的my.in	女生，人生第一支大牌口
防晒不分男女！防晒帽同	手表鉴定 \| 一眼看真

相关文章

站内最新

栏目相关

· 什么是Web3.0，与当下Web有什么区别，在未来真的能实现吗？

· 手机Python编程神器——AidLearning

· 基于Python+vue的自动化运维、完全开源的云管理平台

· python接口自动化之MySQL数据连接

· Python异步之aiohttp

· Python Queue 进阶用法

· python四大特性（封装，继承，重写，多态）

· Python自动化之Python输出函数

· Python request使用方法及问题总结

· 用通俗易懂的多态世界观实例：理解python类的多态

· 爬虫利器 Beautiful Soup 之遍历文档

· 告别加班！Python批量生成合同文档，解决合同重复制作问题

· python端口遍历

· python爬虫之爬取疫情数据

· python 一键生成对账单

· Python 模块 collections

· Python接入不同类型数据库的通用接口方法

· 提效工具-python解析xmind文件及xmind用例统计

· python带你采集汽车数据，以后买车就有参考了

· Python 全自动解密解码神器—Ciphey

站内热门

相关头条

· Python自动化之Python输出函数

· python带你采集汽车数据，以后买车就有参考了

· 用pandas爬取数据，太实用了

· Python数据分析学习三步曲

· Python 3.11比3.10 快60%：使用冒泡排序和递归函数对比测试

· Python 增强视频画质，就这么做

· Python 图像处理

· Python 带你采集抖音无水印视频内容，把你喜欢的视频保存

· 手把手教你写20个Python小游戏，童年的回忆有趣又好玩「附源码」

· python数据类型-列表(list)

· 68 个 Python 内置函数详解

· Python编码封装

· 用Python直观查看贵州茅台股票交易数据

· 初识python正则表达式

· Python实现天气查询功能

· 3个提升Python运行速度的方法，很实用

· 详解Python软件安装教程和配置，小白都能看懂的教程，值得收藏

· Python发送微信消息（文字、图片、文件）给指定好友和微信群

· Python中的五种下划线

· python time库（时间库）学习和应用

站内头条

网站首页 | 关于我们 | 服务条款 | 广告服务 | 联系我们 | 网站地图 | 免责声明 | 手机版

Copyright @ 简易百科 V 2.0 ©2020-2022 ISOLVES.com | 电脑百科 | 生活百科 | 手机百科 | 简易号
京ICP备14042104号　　

京公网安备 11010802035086号　　QQ：2595517585

简易百科手机版