10行代码搞定图Transformer，图神经网络框架DGL迎来1.0版本

时间：2023-03-08 11:57:23 来源：机器之心作者：

2019 年，纽约大学、亚马逊云科技联手推出图神经网络框架 DGL (Deep Graph Library)。如今 DGL 1.0 正式发布！DGL 1.0 总结了过去三年学术界或工业界对图深度学习和图神经网络（GNN）技术的各类需求。从最先进模型的学术研究到将 GNN 扩展到工业级应用，DGL 1.0 为所有用户提供全面且易用的解决方案，以更好的利用图机器学习的优势。

DGL 1.0 为不同场景提供的解决方案。

DGL 1.0 采用分层和模块化的设计，以满足各种用户需求。本次发布的关键特性包括：

100 多个开箱即用的 GNN 模型示例，15 多个在 Open Graph Benchmark（OGB）上排名靠前的基准模型；
150 多个 GNN 常用模块，包括 GNN 层、数据集、图数据转换模块、图采样器等，可用于构建新的模型架构或基于 GNN 的解决方案；
灵活高效的消息传递和稀疏矩阵抽象，用于开发新的 GNN 模块；
多 GPU 和分布式训练能力，支持在百亿规模的图上进行训练。

DGL 1.0 技术栈图

地址：https://Github.com/dmlc/dgl

此版本的亮点之一是引入了 DGL-Sparse，这是一个全新的编程接口，使用了稀疏矩阵作为核心的编程抽象。DGL-Sparse 不仅可以简化现有的 GNN 模型（例如图卷积网络）的开发，而且还适用于最新的模型，包括基于扩散的 GNN，超图神经网络和图 Transformer。

DGL 1.0 版本的发布在外网引起了热烈反响，深度学习三巨头之一 Yann Lecun、新加坡国立大学副教授 Xavier Bresson 等学者都点赞并转发。

在接下来的文章中，作者概述了两种主流的 GNN 范式，即消息传递视图和矩阵视图。这些范式可以帮助研究人员更好地理解 GNN 的内部工作机制，而矩阵视角也是 DGL Sparse 开发的动机之一。

消息传递视图和矩阵视图

电影《降临》中有这么一句话：「你所使用的语言决定了你的思维方式，并影响了你对事物的看法。」这句话也适合 GNN。

表示图神经网络有两种不同的范式。第一种称为消息传递视图，从细粒度、局部的角度表达 GNN 模型，详细描述如何沿边交换消息以及节点状态如何进行相应的更新。第二种是矩阵视角，由于图与稀疏邻接矩阵具有代数等价性，许多研究人员选择从粗粒度、全局的角度来表达 GNN 模型，强调涉及稀疏邻接矩阵和特征向量的操作。

消息传递视角揭示了 GNN 与 Weisfeiler Lehman （WL）图同构测试之间的联系，后者也依赖于从邻居聚合信息。而矩阵视角则从代数角度来理解 GNN，引发了一些有趣的发现，比如过度平滑问题。

总之，这两种视角都是研究 GNN 不可或缺的工具，它们互相补充，帮助研究人员更好地理解和描述 GNN 模型的本质和特性。正是基于这个原因，DGL 1.0 发布的主要动机之一就是在已有的消息传递接口基础之上，增加对于矩阵视角的支持。

DGL Sparse：为图机器学习设计的稀疏矩阵库

DGL 1.0 版本中新增了一个名为 DGL Sparse 的库（dgl.sparse），它和 DGL 中的消息传递接口一起，完善了对于全类型的图神经网络模型的支持。DGL Sparse 提供专门用于图机器学习的稀疏矩阵类和操作，使得在矩阵视角下编写 GNN 变得更加容易。在下一节中，作者演示多个 GNN 示例，展示它们在 DGL Sparse 中的数学公式和相应的代码实现。

图卷积网络（Graph Convolutional.NETwork）

GCN 是 GNN 建模的先驱之一。GCN 可以同时用消息传递视图和矩阵视图来表示。下面的代码比较了 DGL 中用这两种方法实现的区别。

使用消息传递 API 实现 GCN

使用 DGL Sparse 实现 GCN

基于图扩散的 GNN

图扩散是沿边传播或平滑节点特征或信号的过程。PageRank 等许多经典图算法都属于这一类。一系列研究表明，将图扩散与神经网络相结合是增强模型预测有效且高效的方法。下面的等式描述了其中比较有代表性的模型 AppNP 的核心计算。它可以直接在 DGL Sparse 中实现。

超图神经网络

超图是图的推广，其中边可以连接任意数量的节点（称为超边）。超图在需要捕获高阶关系的场景中特别有用，例如电子商务平台中的共同购买行为，或引文网络中的共同作者等。超图的典型特征是其稀疏的关联矩阵，因此超图神经网络 (HGNN) 通常使用稀疏矩阵定义。以下是超图卷积网络（Feng et al., 2018）和其代码实现。

图 Transformer

Transformer 模型已经成为自然语言处理中最成功的模型架构。研究人员也开始将 Transformer 扩展到图机器学习。Dwivedi 等人开创性地提出将所有多头注意力限制为图中连接的节点对。通过 DGL Sparse 工具，只需 10 行代码即可轻松实现该模型。

DGL Sparse 的关键特性

相比 scipy.sparse 或 torch.sparse 等稀疏矩阵库，DGL Sparse 的整体设计是为图机器学习服务，其中包括了以下关键特性：

自动稀疏格式选择：DGL Sparse 的设计让用户不必为了选择正确的数据结构存储稀疏矩阵（也称为稀疏格式）而烦恼。用户只需要记住 dgl.sparse.spmatrix 创建稀疏矩阵，而 DGL 在内部则会根据调用的算子来自动选择最优格式；
标量或矢量非零元素：很多 GNN 模型会在边上学习多个权重（如 Graph Transformer 示例中演示的多头注意力向量）。为了适应这种情况，DGL Sparse 允许非零元素具有向量形状，并扩展了常见的稀疏操作，例如稀疏 - 稠密 - 矩阵乘法（SpMM）等。可以参考 Graph Transformer 示例中的 bspmm 操作。

通过利用这些设计特性，与之前使用消息传递接口的矩阵视图模型的实现相比，DGL Sparse 将代码长度平均降低了 2.7 倍。简化的代码还使框架的开销减少 43%。此外DGL Sparse 与 PyTorch 兼容，可以轻松与 PyTorch 生态系统中的各种工具和包集成。

开始使用 DGL 1.0

DGL 1.0 已经在全平台发布，并可以使用 pip 或 conda 轻松安装。除了前面介绍的示例之外，DGL Sparse 的第一个版本还包括 5 个教程和 11 个端到端示例，所有教程都可以在 google Colab 中直接体验，无需本地安装。

想了解更多关于 DGL 1.0 的新功能，请参阅作者的发布日志。如果您在使用 DGL 的过程中遇到任何问题或者有任何建议和反馈，也可以通过 Discuss 论坛或者 Slack 联系到 DGL 团队。

Tags：框架点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Web Components实践：如何搭建一个框架无关的AI组件库

一、让人又爱又恨的Web ComponentsWeb Components是一种用于构建可重用的Web元素的技术。它允许开发者创建自定义的HTML元素，这些元素可以在不同的Web应用程序中重复使用，并且...【详细内容】

2024-04-03　　Search: 框架点击:(8)　　评论:(0)　　加入收藏

Htmx，它到底是框架还是库？

在最近的前端开发技术的探讨中，htmx经常成为热议的话题。一些人批评它，认为尽管htmx批评现代前端框架过于复杂，但它自己却似乎也是一个复杂的框架。这种看法值得我们深入思考。...【详细内容】

2024-03-28　　Search: 框架点击:(16)　　评论:(0)　　加入收藏

五大跨平台桌面应用开发框架：Electron、Tauri、Flutter等

一、什么是跨平台桌面应用开发框架跨平台桌面应用开发框架是一种工具或框架，它允许开发者使用一种统一的代码库或语言来创建能够在多个操作系统上运行的桌面应用程序。传统上...【详细内容】

2024-02-26　　Search: 框架点击:(47)　　评论:(0)　　加入收藏

Spring Security权限控制框架使用指南

在常用的后台管理系统中，通常都会有访问权限控制的需求，用于限制不同人员对于接口的访问能力，如果用户不具备指定的权限,则不能访问某些接口。本文将用 waynboot-mall 项目举例...【详细内容】

2024-02-19　　Search: 框架点击:(39)　　评论:(0)　　加入收藏

Go Gin框架实现优雅地重启和停止

在Web应用程序中，有时候我们需要重启或停止服务器，无论是因为更新代码还是进行例行维护。在这种情景下，我们需要保证应用程序的可用性和数据的一致性。这就需要优雅地关闭和重...【详细内容】

2024-01-30　　Search: 框架点击:(67)　　评论:(0)　　加入收藏

链世界：一种简单而有效的人类行为Agent模型强化学习框架

强化学习是一种机器学习的方法，它通过让智能体（Agent）与环境交互，从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用，例如游戏、机器人、自动驾...【详细内容】

2024-01-30　　Search: 框架点击:(68)　　评论:(0)　　加入收藏

OpenHarmony - 基于ArkUI框架实现日历应用

前言对于刚刚接触OpenHarmony应用开发的开发者，最快的入门方式就是开发一个简单的应用，下面记录了一个日历应用的开发过程，通过日历应用的开发，来熟悉基本图形的绘制，ArkUI的组件...【详细内容】

2024-01-16　　Search: 框架点击:(54)　　评论:(0)　　加入收藏

阿里“AI替换万物”框架火爆社区，网友：偶像不需要真人了？

白交发自凹非寺量子位 | 公众号 QbitAIReplace Anything as you want。现在只需框住你需要保留的区域，AI就可以替换万物了！比如让霉霉穿上中国旗袍，结果发饰、服装、背景等各...【详细内容】

2024-01-15　　Search: 框架点击:(66)　　评论:(0)　　加入收藏

分布式事务框架选择与实践

分布式事务是处理跨多个服务的原子操作的关键概念，而选择适合应用场景的框架对于确保事务一致性至关重要。以下是几个常见的分布式事务框架，并讨论它们的使用和实践。1. XA协...【详细内容】

2024-01-05　　Search: 框架点击:(96)　　评论:(0)　　加入收藏

JavaScript前端框架2024年展望

Angular、Next.js、React和Solid的维护者和创作者们展望2024年，分享了他们计划中的改进。译自2024 Predictions by JavaScript Frontend Framework Maintainers，作者 Loraine...【详细内容】

2024-01-05　　Search: 框架点击:(91)　　评论:(0)　　加入收藏

▌简易百科推荐

Web Components实践：如何搭建一个框架无关的AI组件库

2024-04-03　　京东云开发者　　　　Tags:Web Components 　点击:(8)　　评论:(0)　　加入收藏

Kubernetes 集群 CPU 使用率只有 13% ：这下大家该知道如何省钱了

作者 | THE STACK译者 | 刘雅梦策划 | Tina根据 CAST AI 对 4000 个 Kubernetes 集群的分析，Kubernetes 集群通常只使用 13% 的 CPU 和平均 20% 的内存，这表明存在严重的过度...【详细内容】

2024-03-08　　InfoQ　　　　Tags:Kubernetes 　点击:(12)　　评论:(0)　　加入收藏

Spring Security：保障应用安全的利器

SpringSecurity作为一个功能强大的安全框架，为Java应用程序提供了全面的安全保障，包括认证、授权、防护和集成等方面。本文将介绍SpringSecurity在这些方面的特性和优势，以及它...【详细内容】

2024-02-27　　风舞凋零叶　　　　Tags:Spring Security 　点击:(54)　　评论:(0)　　加入收藏

五大跨平台桌面应用开发框架：Electron、Tauri、Flutter等

2024-02-26　　贝格前端工场　　　　Tags:框架　点击:(47)　　评论:(0)　　加入收藏

Spring Security权限控制框架使用指南

2024-02-19　　程序员wayn　　微信公众号　　Tags:Spring 　点击:(39)　　评论:(0)　　加入收藏

开发者的Kubernetes懒人指南

你可以将本文作为开发者快速了解 Kubernetes 的指南。从基础知识到更高级的主题，如 Helm Chart，以及所有这些如何影响你作为开发者。译自Kubernetes for Lazy Developers。作...【详细内容】

2024-02-01　　云云众生s　　微信公众号　　Tags:Kubernetes 　点击:(50)　　评论:(0)　　加入收藏

链世界：一种简单而有效的人类行为Agent模型强化学习框架

2024-01-30　　大噬元兽　　微信公众号　　Tags:框架　点击:(68)　　评论:(0)　　加入收藏

Spring实现Kafka重试Topic，真的太香了

概述Kafka的强大功能之一是每个分区都有一个Consumer的偏移值。该偏移值是消费者将读取的下一条消息的值。可以自动或手动增加该值。如果我们由于错误而无法处理消息并想重...【详细内容】

2024-01-26　　HELLO程序员　　微信公众号　　Tags:Spring 　点击:(86)　　评论:(0)　　加入收藏

SpringBoot如何实现缓存预热？

缓存预热是指在 Spring Boot 项目启动时，预先将数据加载到缓存系统（如 Redis）中的一种机制。那么问题来了，在 Spring Boot 项目启动之后，在什么时候？在哪里可以将数据加载到缓存系...【详细内容】

2024-01-19　　 Java中文社群　　微信公众号　　Tags:SpringBoot 　点击:(86)　　评论:(0)　　加入收藏

花 15 分钟把 Express.js 搞明白，全栈没有那么难

Express 是老牌的 Node.js 框架，以简单和轻量著称，几行代码就可以启动一个 HTTP 服务器。市面上主流的 Node.js 框架，如 Egg.js、Nest.js 等都与 Express 息息相关。Express 框...【详细内容】

2024-01-16　　程序员成功　　微信公众号　　Tags:Express.js 　点击:(88)　　评论:(0)　　加入收藏

推荐资讯

新增融券再启动暂停键	16个Redis常见使用场
一篇文章教会你使用Py	聊聊Rust里面的数据类
C++中的外部模板及其	一篇文章带你了解Pyth
网络安全行业的春天何	Linux获取Redis 性能