您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Python

100 个数据分析 python 库大总结!

时间:2023-11-18 16:47:05  来源:  作者:程序员不二

100 个数据分析 python 库大总结!

数据处理与分析

PandasGUI

一个具有图形用户界面的惊人库,可简化数据操作和可视化功能

polars

Polars 是一个开源且相对较新的数据分析和处理库,为广泛流行的 Pandas 库提供了替代方案。

PyGWalker

PyGWalker 是一个非常强大的数据分析库。

pandas-profiling

pandas-profiling 库为你提供了一种生成给定数据帧的分析报告的方法。

Lux

Lux 可通过自动化可视化和数据分析过程来促进快速、轻松的数据探索。

AutoViz

借助 AutoViz,你可以轻松快速地为数据生成富有洞察力的可视化效果。无论你是数据分析的初学者还是专家,AutoViz 都可以帮助你探索数据并发现有价值的见解。

Sweetviz

利用 Sweetviz 可以生成漂亮的高密度可视化效果,从而通过一行代码启动 EDA(探索性数据分析)。输出是一个完全独立的 html 应用程序。

Bamboolib

如果有一种方法可以通过 GUI 访问 pandas 的功能怎么样?这就是 Bamboolib 发挥作用的地方。

Spotlight

Spotlight 是一种开源工具,提供了一种简化的交互式方法来探索数据。

它简化了可视化创建,支持自定义视图,并允许轻松与数据点交互。

Mito

Mito 是一个令人难以置信的开源工具,允许你在 Jupyter 的电子表格界面中分析数据,而无需编写任何代码。

Dataprep

Dataprep 是一个开源的 Python/ target=_blank class=infotextkey>Python 库,它的主要目标是简化和加快数据科学操作,特别关注简化「探索性数据分析(EDA) 阶段」。

D-Tale

D-Tale 是一个 Python 库,「为数据探索、分析和可视化提供了交互式且易于使用的界面」。它构建在流行的数据操作和可视化库(例如 Pandas、Plotly 和 Flask)之上。

visualpython

Visual Python 是一个开源项目,除了对各种 Python 数据科学库(pandas、seaborn 等)的强大支持之外,还可以使用 python 轻松处理「重复的数据科学任务」。

asqlcell

asqlcell 是一个开源的 Jupyter 插件,可以让你在 Jupyter 中使用 sql 就可以分析数据。对于不熟悉 python 的人非常友好。

missingno

Missingno 是一个 Python 库,用于「可视化数据集中缺失的数据」。

超参数搜索

KerasTuner

KerasTuner 是一个易于使用、可扩展的「超参数优化框架」,「解决了超参数搜索的痛点」。

Optuna

Optuna 使用户能够采用最先进的算法来采样超参数并修剪无希望的试验。

机器学习

catboost

catboost 是一个「高性能梯度提升库」,为机器学习任务提供最先进的解决方案。用于分类、回归和其他机器学习任务。支持在 CPU 和 GPU 上的计算。

自动化机器学习

PyCaret

PyCaret 是一个开源的、低代码的 Python 机器学习库,可自动化机器学习工作流程。

AutoGluon

AutoGluon 可自动执行机器学习任务,使你能够在应用程序中轻松实现强大的预测性能。

LazyPredict

LazyPredict 是一个强大的机器学习 Python 库,它提供了一种易于使用且方便的方法来「同时比较各种机器学习模型」。

Hyperopt-sklearn

「Hyperopt-sklearn」 是一个流行的 Python 库,旨在简化 scikit-learn 模型的超参数优化过程。

FLAML

FLAML 是一个轻量级的 Python 库,用于高效自动化机器学习和 AI 操作。它基于大型语言模型、机器学习模型等自动化工作流程并优化其性能。

Scikit-optimize

Scikit-optimize 是一个功能强大且易于使用的 Python 库,「用于优化机器学习模型的超参数和其他优化问题」。

Yellowbrick

Yellowbrick 是一个 Python 库,它提供了一个高级接口,用于创建可视化和诊断工具来分析机器学习算法。

mljar-supervised

mljar-supervised 是一个「可处理表格数据的自动化机器学习 Python 库」。

explainerdashboard

explainerdashboard 提供有关模型性能、特征重要性、特征对个体预测的贡献、“假设”分析、部分依赖图、SHAP(交互)值、个体决策树可视化等的交互式图。

TPOT

TPOT 是一个 Python 「自动化机器学习工具」,可使用「遗传编程」优化机器学习管道。

AutoKeras

AutoKeras 是基于 Keras 的 AutoML 系统,它的目标是让每个人都能使用机器学习。

BentoML

BentoML 是一个用于构建「可靠、可扩展且经济高效的 AI 应用程序的」框架。

它配备了模型服务、应用程序打包和生产部署所需的一切。「它旨在简化流程,使其更加易于管理和高效。」

feature-engine

feature-engine 是一个开源的 Python 库,具有多个转换器,「用于设计和选择机器学习模型的特征」。

EvalML

「EvalML 库是一种使用管道构建机器学习模型的」自动化工具。

pandas-ta

pandas-ta 是一个易于使用的 python 库,让你可以从「时间序列中提取技术分析指标」。

时间序列处理

neuralprophet

NeuralProphet 是一个「易于学习的可解释时间序列预测框架」。NeuralProphet 基于 PyTorch 构建,「结合了神经网络和传统时间序列算法」,受到 Facebook Prophet 和 AR.NET 的启发。它将神经网络的灵活性与传统预测方法的直观建模相结合。

mlforecast

mlforecast 是一个专门为大规模时间序列预测而设计的最先进的机器学习库。

prophet

Prophet 是一个由 Facebook 开源的代码库,它特别适用于「具有强季节性的数据」,例如日活跃用户数、年度销售额等。Prophet 的目标是使时间序列预测过程尽可能简单,即便是非专业人士也能轻松使用。

ChatGPT 相关

Pandas AI

一个将生成人工智能功能集成到 Pandas 中的 Python 库,可以使用对话式的方式来操作 DataFrame。

Scikit-LLM

Scikit-LLM 是文本分析领域的颠覆者。它将强大的语言模型( 如 ChatGPT )与 scikit-learn 结合在一起。

Code Interpreter

ChatGPT 代码解释器的开源实现。它允许你执行数据集分析并可视化数据。

DemoGPT

只需一个提示,你就可以通过 LangChain 的变革能力创建交互式的 Streamlit 应用程序。

Chapyter

Chapyter 是 JupyterLab Notebook 的扩展,可将 ChatGPT 无缝连接到你的编码环境。

YOLOPandas

YOLOPandas 是一个开源库,允许你使用自然语言指定命令并直接在 Pandas 对象上执行它们。

open-interpreter

使用 Open Interpreter,你可以直接在本地计算机上运行代码解释器。

ChatDev

使用 ChatDev , 你可以通过「自然语言来创建定制化的软件」。

Embedchain

Embedchain 是一个开源的 python 库,可以在任何数据集上轻松创建 LLM(大语言模型) 支持的机器人的框架。

lida

LIDA 是一个使用大型语言模型「「自动生成可视化和信息图表」」的库,它与语法无关(可与任何编程语言和可视化库配合使用,例如 matplotlib、seaborn、altair、d3 等),并可与多个大型语言模型提供商(OpenAI、Azure OpenAI、PaLM、Cohere、Huggingface)配合使用。

可视化相关

Panel

Panel 是一个开源的 Python 库,可让你完全使用Python轻松构建强大的工具、仪表板和复杂的应用程序。

plotnine

plotnine 是基于 ggplot2 的 Python 图形语法实现。该语法允许你通过将数据变量显式映射到构成绘图的视觉对象来组成绘图。https://mp.weixin.qq.com/s?__biz=MzU5NjE0NjI1MQ==&mid=2247488578&idx=1&sn=14a4e9691a2527e094ef71e77e9ac155&chksm=fe667566c911fc70063e1db94fb35c54aff543a4d8fcabfad8d16b8fc51a62154d9aaad208be&token=888886507&lang=zh_CN&scene=21#wechat_redirect

Altair

Altair 是一个 Python 统计可视化库。与 Matplotlib 和 Seaborn 相比,Altair 更注重统计特征。Altair 凭借其强大而简洁的可视化语法,可帮助你快速构建各种可视化效果。

bokeh

「Bokeh 是 Python 中一个适用于现代 Web 浏览器的交互式可视化库」,为数据科学家分析数据提供交互式和复杂的功能。

bqplot

它是一个适用于 Jupyter Notebook 的交互式绘图库,「允许用户只需几行代码即可创建复杂的可视化效果」。

Kangas

Kangas 是越来越流行的「图像数据处理和分析工具之一」。与 Pandas 彻底改变数据分析师处理表格数据的方式类似,Kangas 也在计算机视觉任务中做同样的事情。

Plotly

plotly.py 是一个「交互式、开源、基于浏览器」的 Python 图形库。

d3blocks

d3blocks 是一个包含各种图表的库,其可视化部分基于 (d3) JAVAscript 构建,只需几行 Python 代码即可创建最具视觉吸引力和实用性的图表。

folium

folium 是一个功能强大的 Python 库,可以轻松可视化地理空间数据。

seaborn

seaborn 是一个数据可视化库,可简化创建复杂且美观的可视化的过程。它带有内置主题和调色板,可增强视觉体验。

VisPy

VisPy 是一个高性能交互式 2D/3D 数据可视化库。VisPy 通过 OpenGL 库利用现代图形处理单元 (GPU) 的计算能力来显示非常大的数据集。

GUI 相关

nicegui

NiceGUI 是一个基于 Python 的 Web UI 框架,旨在简化 Python 前端应用程序的开发,特别是在机器学习和数据科学领域。

solara

Solara 是最近推出的一个框架,用于用纯 Python 构建 Web 应用程序。

DearPyGUI

DearPyGUI 是一个「简单易用的 Python GUI 库」。它采用了一个独特的方法来创建图形用户界面,即通过一系列命令式的函数调用而不是传统的对象指向方式。

shiny

shiny 是一个流行的 python 库,使用 shiny 可以快速构建美观的 Web 应用程序。

streamlit

Streamlit 是一个开源的 python 库,「可让你在几分钟内将数据脚本转变为可共享的 Web 应用程序。」

数据分析在 GPU 上运行

Xorbits

Xorbits 可以利用多核或 GPU 来加速单台机器上的计算,或扩展到数千台机器以支持处理 TB 级数据以及训练或服务大型模型。

cupy

CuPy 是一个与 NumPy 和 SciPy 数组兼容的 Python 库,「专为 GPU 加速计算而设计」。

cudf

cuDF 是一个由 NVIDIA 开发的 Python 库,它是 RAPIDS 数据科学框架的一部分。RAPIDS 旨在利用 NVIDIA 的 CUDA 技术,「通过 GPU 加速数据科学和分析应用程序。」

知识图谱相关

networkx

NetworkX 用于「创建、操作和研究复杂网络的结构、动态和功能」。

pyvis

pyvis 是一个用于「创建和可视化交互式网络图」的 Python 库。

数学相关

sympy

在 Python 中,有一些用于代数的第三方模块。我最喜欢的之一是 “SymPy”,它封装了大量方法来帮助「数据工程师快速解决常见的数学问题。」

scipy

scipy 是一个开源的 Python 库,「用于解决科学和数学问题」。它构建于 NumPy 之上,允许用户使用各种高级命令来操作和可视化数据。

latexify

latexify 是一个开源的 Python 库,旨在「将 Python 代码转换为 LaTeX 格式的方程」。

python 效率提升

Numba

Numba 可用于加速 Python 函数,而无需编写任何 C 或 C++ 代码。

其它

Segno

Segno 是一个用于创建二维码的 python 库。

icecream

IceCream 是一个 Python 库,「可以使用最少的代码轻松进行代码调试」。

loguru

Loguru 是一个旨在为 Python 带来愉快的日志记录的库,它可以完全增强你的日志记录体验,并且非常易于使用。

Rich

Rich 是一个 python 库,「用于在终端中提供富文本和漂亮的格式设置。」



Tags:python 库   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
5 个让日常编码更简单的 Python 库
如果曾经在 Python 中使用过 subprocess 库,那么我们很有可能对它感到失望,它不是最直观的库,可能还有些复杂,并且很难处理底层系统调用的输出。但是 sh 库结束了低效使用子进程...【详细内容】
2023-12-14  Search: python 库  点击:(155)  评论:(0)  加入收藏
五个堪称瑰宝级的 Python 库,建议收藏!
Python是一种广泛使用的高级编程语言,拥有丰富的生态系统和庞大的开发社区。在这个生态系统中,有许多优秀的Python库,它们为开发者提供了丰富的功能和工具,极大地简化了开发过程...【详细内容】
2023-12-06  Search: python 库  点击:(168)  评论:(0)  加入收藏
掌握九个好用的 Python 库
当谈到Python编程的强大之处时,不得不提到其丰富的库和模块。这些库可以帮助我们简化开发过程并提供丰富的功能,从而使我们的代码更加高效和强大。在本文中,笔者将向大家介绍九...【详细内容】
2023-12-06  Search: python 库  点击:(181)  评论:(0)  加入收藏
100 个数据分析 python 库大总结!
数据处理与分析PandasGUI一个具有图形用户界面的惊人库,可简化数据操作和可视化功能polarsPolars 是一个开源且相对较新的数据分析和处理库,为广泛流行的 Pandas 库提供了替代...【详细内容】
2023-11-18  Search: python 库  点击:(141)  评论:(0)  加入收藏
将 Pandas 换为交互式表格的 Python 库
Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可...【详细内容】
2023-08-27  Search: python 库  点击:(304)  评论:(0)  加入收藏
2022 年顶级机器学习算法和 Python 库
新的算法很难产生,2022 年可能也不例外。然而,仍有一些机器学习算法和 Python 库将在未来更受欢迎。这些算法之所以与众不同,是因为它们包含了一些在其它算法中并不普遍的优点...【详细内容】
2022-02-20  Search: python 库  点击:(502)  评论:(0)  加入收藏
非常实用的 Python 库,推一次火一次
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】
2021-12-27  Search: python 库  点击:(406)  评论:(0)  加入收藏
终于把所有的 Python 库都整理出来啦
常用库 Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable主要用于在终端或浏览器端构建格式化的输出。 difflib,[Python]标准库,计算...【详细内容】
2021-05-24  Search: python 库  点击:(447)  评论:(0)  加入收藏
这款Python 库 4行代码提取图片中的文字
OCR是什么?有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面...【详细内容】
2021-01-12  Search: python 库  点击:(535)  评论:(0)  加入收藏
▌简易百科推荐
Python 可视化:Plotly 库使用基础
当使用 Plotly 进行数据可视化时,我们可以通过以下示例展示多种绘图方法,每个示例都会有详细的注释和说明。1.创建折线图import plotly.graph_objects as go# 示例1: 创建简单...【详细内容】
2024-04-01  Python技术    Tags:Python   点击:(8)  评论:(0)  加入收藏
Python 办公神器:教你使用 Python 批量制作 PPT
介绍本文将介绍如何使用openpyxl和pptx库来批量制作PPT奖状。本文假设你已经安装了python和这两个库。本文的场景是:一名基层人员,要给一次比赛活动获奖的500名选手制作奖状,并...【详细内容】
2024-03-26  Python技术  微信公众号  Tags:Python   点击:(15)  评论:(0)  加入收藏
Python实现工厂模式、抽象工厂,单例模式
工厂模式是一种常见的设计模式,它可以帮助我们创建对象的过程更加灵活和可扩展。在Python中,我们可以使用函数和类来实现工厂模式。一、Python中实现工厂模式工厂模式是一种常...【详细内容】
2024-03-07  Python都知道  微信公众号  Tags:Python   点击:(31)  评论:(0)  加入收藏
不可不学的Python技巧:字典推导式使用全攻略
Python的字典推导式是一种优雅而强大的工具,用于创建字典(dict)。这种方法不仅代码更加简洁,而且执行效率高。无论你是Python新手还是有经验的开发者,掌握字典推导式都将是你技能...【详细内容】
2024-02-22  子午Python  微信公众号  Tags:Python技巧   点击:(32)  评论:(0)  加入收藏
如何进行Python代码的代码重构和优化?
Python是一种高级编程语言,它具有简洁、易于理解和易于维护的特点。然而,代码重构和优化对于保持代码质量和性能至关重要。什么是代码重构?代码重构是指在不改变代码外部行为的...【详细内容】
2024-02-22  编程技术汇    Tags:Python代码   点击:(32)  评论:(0)  加入收藏
Python开发者必备的八个PyCharm插件
在编写代码的过程中,括号几乎无处不在,以至于有时我们会拼命辨别哪个闭合括号与哪个开头的括号相匹配。这款插件能帮助解决这个众所周知的问题。前言在PyCharm中浏览插件列表...【详细内容】
2024-01-26  Python学研大本营  微信公众号  Tags:PyCharm插件   点击:(84)  评论:(0)  加入收藏
Python的Graphlib库,再也不用手敲图结构了
Python中的graphlib库是一个功能强大且易于使用的工具。graphlib提供了许多功能,可以帮助您创建、操作和分析图形对象。本文将介绍graphlib库的主要用法,并提供一些示例代码和...【详细内容】
2024-01-26  科学随想录  微信公众号  Tags:Graphlib库   点击:(86)  评论:(0)  加入收藏
Python分布式爬虫打造搜索引擎
简单分布式爬虫结构主从模式是指由一台主机作为控制节点负责所有运行网络爬虫的主机进行管理,爬虫只需要从控制节点那里接收任务,并把新生成任务提交给控制节点就可以了,在这个...【详细内容】
2024-01-25  大雷家吃饭    Tags:Python   点击:(58)  评论:(0)  加入收藏
使用Python进行数据分析,需要哪些步骤?
Python是一门动态的、面向对象的脚本语言,同时也是一门简约,通俗易懂的编程语言。Python入门简单,代码可读性强,一段好的Python代码,阅读起来像是在读一篇外语文章。Python这种特...【详细内容】
2024-01-15  程序员不二    Tags:Python   点击:(161)  评论:(0)  加入收藏
Python语言的特点及应用场景, 同其它语言对比优势
Python语言作为一种高级编程语言,具有许多独特的特点和优势,这使得它在众多编程语言中脱颖而出。在本文中,我们将探讨Python语言的特点、应用场景以及与其他语言的对比优势。一...【详细内容】
2024-01-09    今日头条  Tags:Python语言   点击:(251)  评论:(0)  加入收藏
站内最新
站内热门
站内头条