CSV文件又称为逗号分隔值文件,是一种通用的、相对简单的文件格式,用以存储表格数据,包括数字或者字符。CSV是电子表格和数据库中最常见的输入、输出文件格式。
通过爬虫将数据抓取的下来,然后把数据保存在文件,或者数据库中,这个过程称为数据的持久化存储。本节介绍Python/ target=_blank class=infotextkey>Python内置模块CSV的读写操作。
1)csv.writer()
csv模块中的writer类可用于读写序列化的数据,其语法格式如下:
writer(csvfile, dialect='Excel', **fmtparams)1复制代码类型:[JAVAscript]
参数说明:
csvfile:必须是支持迭代(Iterator)的对象,可以是文件(file)对象或者列表(list)对象。
dialect:编码风格,默认为excel的风格,也就是使用逗号,分隔。
fmtparam:格式化参数,用来覆盖之前dialect对象指定的编码风格。
如果想同时写入多行数据,需要使用writerrows()方法,代码如下所示:
import csv
with open('aggs.csv', 'w', newline='') as f:
writer = csv.writer(f)
# 注意传入数据的格式为列表元组格式
writer.writerows([('hello','world'), ('I','love','you')])12345复制代码类型:[JavaScript]
aggs.csv文件内容:
hello,world
I,love,you12复制代码类型:[python]
2)csv.DictWriter()
当然也可使用DictWriter类以字典的形式读写数据,使用示例如下:
import csv
with open('names.csv', 'w', newline='') as csvfile:
#构建字段名称,也就是key
fieldnames = ['first_name', 'last_name']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
# 写入字段名,当做表头
writer.writeheader()
# 多行写入
writer.writerows([{'first_name': 'Baked', 'last_name': 'Beans'},{'first_name': 'Lovely', 'last_name': 'Spam'}])
# 单行写入
writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})1234567891011复制代码类型:[python]
name.csv文件内容,如下所示:
first_name,last_name
Baked,Beans
Lovely,Spam
Wonderful,Spam1234复制代码类型:[python]
1)csv,reader()
csv模块中的reader类和DictReader类用于读取文件中的数据,其中reader()语法格式如下:
csv.reader(csvfile, dialect='excel', **fmtparams)1复制代码类型:[python]
2)csv.DictReader()
应用示例如下:
import csv
with open('names.csv', newline='') as csvfile:
reader = csv.DictReader(csvfile)
for row in reader:
print(row['first_name'], row['last_name'])12345复制代码类型:[python]
输出结果:
Baked Beans
Lovely Spam
Wonderful Spam