Python 失宠！Hugging Face 用 Rust 新写了一个 ML 框架，现已低调开源

时间：2023-08-14 15:55:57 来源：InfoQ 作者：

作者 | 褚杏娟

近期，Hugging Face 低调开源了一个重磅 ML 框架：Candle。Candle 一改机器学习惯用 Python/ target=_blank class=infotextkey>Python 的做法，而是 Rust 编写，重点关注性能（包括 GPU 支持）和易用性。

根据 Hugging Face 的介绍，Candle 的核心目标是让 Serverless 推理成为可能。像 PyTorch 这样的完整机器学习框架非常大，这使得在集群上创建实例的速度很慢。Candle 允许部署轻量级二进制文件。另外，Candle 可以让用户从生产工作负载中删除 Python。Python 开销会严重影响性能，而 GIL 是众所周知的令人头疼的问题。

Rust 真的可以吗？

Pytorch 框架是用 Python 编写的，API 也是基于 Python 的，这让用户上手开发会非常快。另外，Python 本身就是一种简洁而易于学习的编程语言，很适合初学者和专业开发者使用。

但基于 Python 的 Pytorch 框架问题也很明显。相对于一些静态图框架（如 TensorFlow），Python 在某些情况下可能会导致性能问题。Python 的全局解释器锁（GIL）可能会在多线程的情况下影响性能，尤其是在涉及 CPU 密集型任务时。Python 的解释性质还可能会引入一些运行时开销。另外，将基于 Python 的 PyTorch 模型部署到生产环境中可能需要一些额外的步骤，不如其他编译型语言那么方便。

显然，Hugging Face 一直在寻找解决办法，它给出的答案是用时下最快的语言 Rust 重写一个 ML 框架。“最酷的是，这是来自 Hugging Face 的，不仅仅是某人的爱好项目。”有网友赞叹道。实际上，许多 HF 生态系统已经使用 Rust，例如 safetensors、tokenizer。

不过，Rust 的难度也让一些开发者望而却步，“编写 Rust 是一件艰难的事情，你必须跳来跳去，花更多的时间思考编程语言的抽象，而不是思考要解决的问题。所以，我现在还不着急重写任何 Python 的东西。”

开发者“fooblaster”指出，Pytorch 部署模型有多个生产路径无需 Python 解释器，如 torch 和 libtorch，或是更烦人的路径如 onnx export 和 onnx runtime，所以不需要 Rust 来解决这个问题。另外很人知道，现在可以使用 C++ 编写 Torch 训练代码，并与推理和训练共享一种通用语言。

对此，开发者“malcolmgreaves”表示，这些是使模型推理独立于 Python 的伟大技术。然而，总是有大量的预处理、后处理或其他业务逻辑需要围绕模型推理。这种事情需要在通用编程语言中完成，因此 Python 经常被使用（因为支持模型的代码通常是由同一个人编写的，并且这些代码很可能是 Python，因为您的模型训练和 eval 代码很可能也是 Python）。这就是非 Python PL（如 Rust）可以在简化生产部署 / 维护以及具有真正高效的生产推理方面发挥巨大作用的地方。

当然，也有开发者为 Python 打抱不平。

“任何编程语言在生产环境中都可能是一种痛苦。Python 的缺点之一也是它的优点之一。使用 Python 或 JAVA 等‘混乱’语言很容易陷入糟糕的生产环境，因此避免这些痛点的工具已经非常成熟。有了这些，Python 在生产中就会变得很棒。”开发者“devjab”进一步表示，“是的，这将要求您的组织做出一些严肃的 CI 文化决策并强制执行。但问题是，虽然使用某些编程语言可以不必如此，但当企业达到一定规模时，总是会需要它们。因此，更早建立这个流程就会容易得多，而且如果您认真使用 Python，早就会这样做了。我认为，如果在生产环境中工作很痛苦，那么问题不在于技术，而在于流程。”

实际上，业内一直在努力解决 Python 带来的问题。

5 月份，LLVM 和 Swift 编程语言联合创始人 Chris Lattner 创办的新公司 Modular AI 发布了一个名为 Mojo 的新编程语言。Mojo 将 Python 特性与 C、C++ 和 CUDA 的系统编程功能结合了起来，并通过其所谓“极限加速”与其他 Python 速度增强方案区分了开来。据悉，凭借着硬件加速，Mojo 在运行 Mandelbrot 等数字算法时比原始 Python 快上 3.5 万倍。

另一方面，Python 自身也在做改进。最近，Python 终于宣布要删 GIL，Python 默认版本将逐渐过渡到无 GIL 版本。这一决定能否巩固其在机器学习领域的地位，也需要时间验证。

与 PyTorch 对比

据悉，当前 Candle 已经支持如今的前沿模型，像 Llama2。经过改写的模型，比如 Llama2 能够方便、快速的运行在容器环境，甚至可以运行在浏览器中。Candle 结构包括：

Candle-core：核心操作、设备和 Tensor 结构定义。
Candle-nn：构建真实模型的工具。
Candle-examples：在实际设置中使用库的示例。
Candle-kernels：CUDA 自定义内核；
Candle-datasets：数据集和数据加载器。
Candle-Transformers：与 Transformers 相关的实用程序。
Candle-flash-attn：Flash attention v2 层。

Pytorch 和 Candle 对比

该项目正在处于快速迭代过程中，更新非常频繁，很多功能在不断开发中，目前包含如下功能和特点：

语法简单，风格与 PyTorch 相似。
CPU 和 Cuda Backend：m1、f16、bf16。
支持 Serverless（CPU）、小型和快速部署
支持 WASM，可在浏览器中运行模型。
模型训练使用 NCCL 进行分布式计算。
开箱即用的模型：Llama、Whisper、Falcon、StarCoder...
嵌入用户定义的操作 / 内核，如 flash-attention v2。

对于 Hugging Face 的这一新 ML 框架，大家有什么感想或使用感受？欢迎在评论区分享！

参考链接：

https://Github.com/huggingface/candle

https://news.ycombinator.com/item?id=37049198

Tags：ML 框架点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Python 失宠！Hugging Face 用 Rust 新写了一个 ML 框架，现已低调开源

作者 | 褚杏娟近期，Hugging Face 低调开源了一个重磅 ML 框架：Candle。Candle 一改机器学习惯用 Python 的做法，而是 Rust 编写，重点关注性能（包括 GPU 支持）和易用性。根据 Huggi...【详细内容】

2023-08-14　　Search: ML 框架点击:(264)　　评论:(0)　　加入收藏

▌简易百科推荐

Web Components实践：如何搭建一个框架无关的AI组件库

一、让人又爱又恨的Web ComponentsWeb Components是一种用于构建可重用的Web元素的技术。它允许开发者创建自定义的HTML元素，这些元素可以在不同的Web应用程序中重复使用，并且...【详细内容】

2024-04-03　　京东云开发者　　　　Tags:Web Components 　点击:(8)　　评论:(0)　　加入收藏

Kubernetes 集群 CPU 使用率只有 13% ：这下大家该知道如何省钱了

作者 | THE STACK译者 | 刘雅梦策划 | Tina根据 CAST AI 对 4000 个 Kubernetes 集群的分析，Kubernetes 集群通常只使用 13% 的 CPU 和平均 20% 的内存，这表明存在严重的过度...【详细内容】

2024-03-08　　InfoQ　　　　Tags:Kubernetes 　点击:(12)　　评论:(0)　　加入收藏

Spring Security：保障应用安全的利器

SpringSecurity作为一个功能强大的安全框架，为Java应用程序提供了全面的安全保障，包括认证、授权、防护和集成等方面。本文将介绍SpringSecurity在这些方面的特性和优势，以及它...【详细内容】

2024-02-27　　风舞凋零叶　　　　Tags:Spring Security 　点击:(53)　　评论:(0)　　加入收藏

五大跨平台桌面应用开发框架：Electron、Tauri、Flutter等

一、什么是跨平台桌面应用开发框架跨平台桌面应用开发框架是一种工具或框架，它允许开发者使用一种统一的代码库或语言来创建能够在多个操作系统上运行的桌面应用程序。传统上...【详细内容】

2024-02-26　　贝格前端工场　　　　Tags:框架　点击:(47)　　评论:(0)　　加入收藏

Spring Security权限控制框架使用指南

在常用的后台管理系统中，通常都会有访问权限控制的需求，用于限制不同人员对于接口的访问能力，如果用户不具备指定的权限,则不能访问某些接口。本文将用 waynboot-mall 项目举例...【详细内容】

2024-02-19　　程序员wayn　　微信公众号　　Tags:Spring 　点击:(39)　　评论:(0)　　加入收藏

开发者的Kubernetes懒人指南

你可以将本文作为开发者快速了解 Kubernetes 的指南。从基础知识到更高级的主题，如 Helm Chart，以及所有这些如何影响你作为开发者。译自Kubernetes for Lazy Developers。作...【详细内容】

2024-02-01　　云云众生s　　微信公众号　　Tags:Kubernetes 　点击:(50)　　评论:(0)　　加入收藏

链世界：一种简单而有效的人类行为Agent模型强化学习框架

强化学习是一种机器学习的方法，它通过让智能体（Agent）与环境交互，从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用，例如游戏、机器人、自动驾...【详细内容】

2024-01-30　　大噬元兽　　微信公众号　　Tags:框架　点击:(67)　　评论:(0)　　加入收藏

Spring实现Kafka重试Topic，真的太香了

概述Kafka的强大功能之一是每个分区都有一个Consumer的偏移值。该偏移值是消费者将读取的下一条消息的值。可以自动或手动增加该值。如果我们由于错误而无法处理消息并想重...【详细内容】

2024-01-26　　HELLO程序员　　微信公众号　　Tags:Spring 　点击:(84)　　评论:(0)　　加入收藏

SpringBoot如何实现缓存预热？

缓存预热是指在 Spring Boot 项目启动时，预先将数据加载到缓存系统（如 Redis）中的一种机制。那么问题来了，在 Spring Boot 项目启动之后，在什么时候？在哪里可以将数据加载到缓存系...【详细内容】

2024-01-19　　 Java中文社群　　微信公众号　　Tags:SpringBoot 　点击:(86)　　评论:(0)　　加入收藏

花 15 分钟把 Express.js 搞明白，全栈没有那么难

Express 是老牌的 Node.js 框架，以简单和轻量著称，几行代码就可以启动一个 HTTP 服务器。市面上主流的 Node.js 框架，如 Egg.js、Nest.js 等都与 Express 息息相关。Express 框...【详细内容】

2024-01-16　　程序员成功　　微信公众号　　Tags:Express.js 　点击:(86)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个