还在使用 os.path？Python 中的 Pathlib 太香了

时间：2023-08-08 13:46:33 来源：微信公众号作者：啥都会一点的研究生

相信现在依然有很多人习惯于使用os来处理文件/文件夹/路径等，但其实Python/ target=_blank class=infotextkey>Python自带的Pathlib库处理这些更优雅、更安全，你会发现很多大型开源项目都在使用它，那么它到底有什么魅力？花点时间让我们一起看看吧

先看这个引例，假设我们需要获取某个文件夹下所有的txt文件，基于os会写成如下形式

import os

dir_path = "/home/user/documents"# Find all text files inside a directory
files = [os.path.join(dir_path, f) for f in os.listdir(dir_path) if os.path.isfile(os.path.join(dir_path, f)) and f.endswith(".txt")]

使用Pathlib则变成如下形式，是不是心动了

from pathlib import Path

dir_path = Path("/home/user/documents")
files = list(dir_path.glob("*.txt"))

os.path 的最大缺点是将系统路径视为字符串，极容易导致混乱，Pathlib 在Python3.4中被支持，通过将路径表示为独特的对象解决了这个问题，并为路径处理引入更多可扩展用法，许多操作在os需要层层嵌套，而Pathlib将使开发人员更轻松地处理与路径和文件相关的所有事情

处理路径

1. 创建路径

几乎所有pathlib 的功能都可以通过其 Path 子类访问，可以使用该类创建文件和目录

有多种初始化Path的方式，比如，使用当前工作路径

from pathlib import Path

Path.cwd() # PosixPath('/home/user/Downloads')

使用home

Path.home() # PosixPath('/home/user')

同样的可以指定字符串路径创建路径

p = Path("documents") # PosixPath('documents')

使用正斜杠运算符进行路径连接

data_dir = Path(".") / "data"
csv_file = data_dir / "file.csv"
print(data_dir) # data
print(csv_file) # data/file.csv

检查路径是否存在，可以使用布尔函数 exists

data_dir.exists()

检查文件是否存在

csv_file.exists()

使用 is_dir 或 is_file 函数来检查是否为文件夹、文件

data_dir.is_dir()

csv_file.is_file()

大多数路径都与当前运行目录相关，但某些情况下必须提供文件或目录的绝对路径，可以使用 absolute

csv_file.absolute() # PosixPath('/home/user/Downloads/data/file.csv')

如果仍然需要将路径转为字符串，可以调用 str(path) 强制转换

str(Path.home()) # '/home/user'

现如今大多数库都支持 Path 对象，包括 sklearn 、 pandas 、 matplotlib 、 seaborn 等

2. Path属性

Path 对象有许多有用属性，一起来看看这些示例，首先定义一个图片路径

image_file = Path("images/shadousheng.png").absolute() # PosixPath('/home/user/Downloads/images/midjourney.png')

先从 parent 开始，它将返回当前工作目录的上一级

image_file.parent # PosixPath('/home/user/Downloads/images')

获取文件名

image_file.name # 'shadousheng.png'

它将返回带有后缀的文件名，若只想要前缀，则使用stem

image_file.stem # shadousheng

只想要后缀也很简单

image_file.suffix # '.png'

如果要将路径分成多个部分，可以使用 parts

image_file.parts # ('/', 'home', 'user', 'Downloads', 'images', 'shadousheng.png')

如果希望这些组件本身就是 Path 对象，可以使用 parents 属性，它会创建一个生成器

for i in image_file.parents:
    print(i)

# /home/user/Downloads/images
# /home/user/Downloads
# /home/user
# /home
# /

处理文件

想要创建文件并写入内容，不必再使用 open 函数，只需创建一个 Path 对象搭配 write_text 或 write_btyes 即可

markdown = data_dir / "file.md"

# Create (override) and write text
markdown.write_text("# This is a test markdown")

读取文件，可以 read_text 或 read_bytes

markdown.read_text() # '# This is a test markdown'

len(image_file.read_bytes()) # 1962148

但请注意， write_text 或 write_bytes 会覆盖文件的现有内容

# Write new text to existing file
markdown.write_text("## This is a new line")

# The file is overridden
markdown.read_text() # '## This is a new line'

要将新信息附加到现有文件，应该在 a （附加）模式下使用 Path 对象的 open 方法：

# Append text
with markdown.open(mode="a") as file:
    file.write("n### This is the second line")

markdown.read_text() # '## This is a new linen### This is the second line'

使用rename 重命名文件，如在当前目录中重命名，file.md 变成了 new_markdown.md

renamed_md = markdown.with_stem("new_markdown")

markdown.rename(renamed_md) # PosixPath('data/new_markdown.md')

通过 stat().st_size 查看文件大小

# Display file size
renamed_md.stat().st_size # 49

查看最后一次修改文件的时间

from datetime import datetime

modified_timestamp = renamed_md.stat().st_mtime

datetime.fromtimestamp(modified_timestamp) # datetime.datetime(2023, 8, 1, 13, 32, 45, 542693)

st_mtime 返回一个自 1970 年 1 月 1 日以来的秒数。为了使其可读，搭配使用 datatime 的 fromtimestamp 函数。

要删除不需要的文件，可以 unlink

renamed_md.unlink(missing_ok=True)

如果文件不存在，将 missing_ok 设置为 True 则不会引起报错

处理目录

首先，看看如何递归创建目录

new_dir.mkdir(parents=True, exist_ok=True)

默认情况下， mkdir 创建给定路径的最后一个子目录，如果中间父级不存在，则必须将 parents 设置为 True 达到递归创建目的

要删除目录，可以使用 rmdir ，如果给定的路径对象是嵌套的，则仅删除最后一个子目录

new_dir.rmdir()

要在终端上列出 ls 等目录的内容，可以使用 iterdir 。结果将是一个生成器对象，一次生成一个子内容作为单独的路径对象，和os.listdir不同的是，它返回每个内容的绝对路径而不是名字

for p in Path.home().iterdir():
    print(p)
# /home/user/anaconda3
# /home/user/.googleearth
# /home/user/.zcompdump
# /home/user/.ipython
# /home/user/.bashrc

要捕获具有特定扩展名或名称的所有文件，可以将 glob 函数与正则表达式结合使用。

例如，使用 glob("*.txt") 查找主目录中所有文本文件

home = Path.home()
text_files = list(home.glob("*.txt"))

len(text_files) # 3

要递归搜索文本文件（即在所有子目录中），可以glob 与 rglob 结合使用：

all_text_files = [p for p in home.rglob("*.txt")]

len(all_text_files) # 5116

以上就是Pathlib中常用方法，是不是感觉肥肠方便，如果有帮助到你就给个点赞三连吧，我是啥都生，下期再见

Tags：Python 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Python 可视化：Plotly 库使用基础

当使用 Plotly 进行数据可视化时，我们可以通过以下示例展示多种绘图方法，每个示例都会有详细的注释和说明。1.创建折线图import plotly.graph_objects as go# 示例1: 创建简单...【详细内容】

2024-04-01　　Search: Python 点击:(8)　　评论:(0)　　加入收藏

Python 办公神器：教你使用 Python 批量制作 PPT

介绍本文将介绍如何使用openpyxl和pptx库来批量制作PPT奖状。本文假设你已经安装了python和这两个库。本文的场景是：一名基层人员，要给一次比赛活动获奖的500名选手制作奖状，并...【详细内容】

2024-03-26　　Search: Python 点击:(15)　　评论:(0)　　加入收藏

Python实现工厂模式、抽象工厂，单例模式

工厂模式是一种常见的设计模式，它可以帮助我们创建对象的过程更加灵活和可扩展。在Python中，我们可以使用函数和类来实现工厂模式。一、Python中实现工厂模式工厂模式是一种常...【详细内容】

2024-03-07　　Search: Python 点击:(31)　　评论:(0)　　加入收藏

不可不学的Python技巧：字典推导式使用全攻略

Python的字典推导式是一种优雅而强大的工具，用于创建字典（dict）。这种方法不仅代码更加简洁，而且执行效率高。无论你是Python新手还是有经验的开发者，掌握字典推导式都将是你技能...【详细内容】

2024-02-22　　Search: Python 点击:(32)　　评论:(0)　　加入收藏

如何进行Python代码的代码重构和优化？

Python是一种高级编程语言，它具有简洁、易于理解和易于维护的特点。然而，代码重构和优化对于保持代码质量和性能至关重要。什么是代码重构？代码重构是指在不改变代码外部行为的...【详细内容】

2024-02-22　　Search: Python 点击:(32)　　评论:(0)　　加入收藏

Python开发者必备的八个PyCharm插件

在编写代码的过程中，括号几乎无处不在，以至于有时我们会拼命辨别哪个闭合括号与哪个开头的括号相匹配。这款插件能帮助解决这个众所周知的问题。前言在PyCharm中浏览插件列表...【详细内容】

2024-01-26　　Search: Python 点击:(84)　　评论:(0)　　加入收藏

Python的Graphlib库，再也不用手敲图结构了

Python中的graphlib库是一个功能强大且易于使用的工具。graphlib提供了许多功能，可以帮助您创建、操作和分析图形对象。本文将介绍graphlib库的主要用法，并提供一些示例代码和...【详细内容】

2024-01-26　　Search: Python 点击:(86)　　评论:(0)　　加入收藏

大语言模型插件功能在携程的Python实践

作者简介成学，携程高级安全研发工程师，关注Python/Golang后端开发、大语言模型等领域。一、背景2023年初，科技圈最火爆的话题莫过于大语言模型了，它是一种全新的聊天机器人模型，...【详细内容】

2024-01-26　　Search: Python 点击:(73)　　评论:(0)　　加入收藏

如何使用Python、Apache Kafka和云平台构建健壮的实时数据管道

译者 | 李睿审校 | 重楼在当今竞争激烈的市场环境中，为了生存和发展，企业必须能够实时收集、处理和响应数据。无论是检测欺诈、个性化用户体验还是监控系统，现在都需要接近即时...【详细内容】

2024-01-26　　Search: Python 点击:(46)　　评论:(0)　　加入收藏

Python分布式爬虫打造搜索引擎

简单分布式爬虫结构主从模式是指由一台主机作为控制节点负责所有运行网络爬虫的主机进行管理，爬虫只需要从控制节点那里接收任务，并把新生成任务提交给控制节点就可以了，在这个...【详细内容】

2024-01-25　　Search: Python 点击:(58)　　评论:(0)　　加入收藏

▌简易百科推荐

Python 可视化：Plotly 库使用基础

2024-04-01　　Python技术　　　　Tags:Python 　点击:(8)　　评论:(0)　　加入收藏

Python 办公神器：教你使用 Python 批量制作 PPT

2024-03-26　　Python技术　　微信公众号　　Tags:Python 　点击:(15)　　评论:(0)　　加入收藏

Python实现工厂模式、抽象工厂，单例模式

2024-03-07　　Python都知道　　微信公众号　　Tags:Python 　点击:(31)　　评论:(0)　　加入收藏

不可不学的Python技巧：字典推导式使用全攻略

2024-02-22　　子午Python　　微信公众号　　Tags:Python技巧　点击:(32)　　评论:(0)　　加入收藏

如何进行Python代码的代码重构和优化？

2024-02-22　　编程技术汇　　　　Tags:Python代码　点击:(32)　　评论:(0)　　加入收藏

Python开发者必备的八个PyCharm插件

2024-01-26　　Python学研大本营　　微信公众号　　Tags:PyCharm插件　点击:(84)　　评论:(0)　　加入收藏

Python的Graphlib库，再也不用手敲图结构了

2024-01-26　　科学随想录　　微信公众号　　Tags:Graphlib库　点击:(86)　　评论:(0)　　加入收藏

Python分布式爬虫打造搜索引擎

2024-01-25　　大雷家吃饭　　　　Tags:Python 　点击:(58)　　评论:(0)　　加入收藏

使用Python进行数据分析，需要哪些步骤？

Python是一门动态的、面向对象的脚本语言，同时也是一门简约，通俗易懂的编程语言。Python入门简单，代码可读性强，一段好的Python代码，阅读起来像是在读一篇外语文章。Python这种特...【详细内容】

2024-01-15　　程序员不二　　　　Tags:Python 　点击:(161)　　评论:(0)　　加入收藏

Python语言的特点及应用场景, 同其它语言对比优势

Python语言作为一种高级编程语言，具有许多独特的特点和优势，这使得它在众多编程语言中脱颖而出。在本文中，我们将探讨Python语言的特点、应用场景以及与其他语言的对比优势。一...【详细内容】

2024-01-09　　　　今日头条　　Tags:Python语言　点击:(251)　　评论:(0)　　加入收藏

推荐资讯

访问网站显示不安全是	掌握独立站SEO策略，提
快手蓝色小钥匙跳转微	微信朋友圈如何置顶
Facebook新用户扩展怎	详解微信里面的分期可
微信表情包更新：原创设	微信朋友圈功能大改版