系统有万亿条消息怎么存储？

时间：2023-12-26 13:28:08 来源：微信公众号作者：ByteByteGo

我们如何设计一个能存储数万亿条信息的系统?

Discord 的消息存储演进给我们提供了真实案例参考。

下图显示了 Discord 消息存储的演变过程：MongoDB -> Cassandra -> ScyllaDB

系统有万亿条消息怎么存储？图片

第一阶段

2015 年，Discord 的第一个版本建立在单个 MongoDB 之上。2015 年 11 月左右，MongoDB 存储了 1 亿条消息，其内存无法再容纳数据和索引。延迟变得不可预测。消息存储需要转移到另一个数据库。这时 Cassandra 被选中。

第二阶段

2017 年，Discord 拥有 12 个 Cassandra 节点，存储了数十亿条消息。

2022 年初，Discord 拥有 177 个 Cassandra 节点，存储了数万亿条消息。此时，延迟再次变得难以预测，维护的成本也变得过于昂贵。

造成这一问题有几个原因：

Cassandra 使用 LSM 树作为内部数据结构。读取比写入更昂贵。在一台拥有数百名用户的服务器上，可能会有很多并发读取，从而导致热点问题。
维护集群（如压缩 SSTables）会影响性能。
垃圾回收会导致明显的延迟

第三阶段

这时，Discord 重新设计了消息存储的架构：

采用集中式的数据服务，其使用单体 API来访问，并用 Rust 重写。
采用基于 ScyllaDB 的存储。ScyllaDB 是用 C++ 编写的 Cassandra 兼容数据库。

新架构的优势在于：

用 C++ 而不是 JAVA 编写，消除了垃圾回收暂停的干扰。
按核分片模型（Shard-per-Core model）提供更好的负载隔离，防止热分区在节点间产生级联延迟。
优化了反向查询性能，以满足 Discord 的需求。
节点减少到 72 个，同时将每个节点的磁盘空间增加到 9 TB。

为了进一步保护 ScyllaDB，Discord 针对数据服务还做了以下优化：

在 Rust 中构建中间数据服务，限制并发流量峰值。
数据服务位于应用程序接口和数据库之间，可聚合请求。
即使多个用户请求相同的数据，也只需查询一次数据库。
Rust 提供了快速、安全的并发功能，是这种工作负载的理想选择。

优化后的系统性能大大提高：

ScyllaDB 的 p99 读取延迟为 15 毫秒，而 Cassandra 为 40-125 毫秒。
ScyllaDB 的 p99 的写延迟为 5 毫秒，而 Cassandra 为 5-70 毫秒。

该系统可轻松应对世界杯流量高峰。

本文参考 Discord blog。

Tags：存储点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

从 MySQL 到 ByteHouse，抖音精准推荐存储架构重构解读

ByteHouse是一款OLAP引擎，具备查询效率高的特点，在硬件需求上相对较低，且具有良好的水平扩展性，如果数据量进一步增长，可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】

2024-03-22　　Search: 存储点击:(23)　　评论:(0)　　加入收藏

云计算：数据存储与处理的革命性技术

当我们谈论“云计算”时，我们实际上在讨论的是一种基于互联网的新型计算模式。云计算允许用户通过网络访问并使用存储在数据中心（也称为“云”）的共享计算资源。这些资源可以包...【详细内容】

2024-03-04　　Search: 存储点击:(18)　　评论:(0)　　加入收藏

C# 线程本地存储为什么线程间值不一样

为什么用 ThreadStatic 标记的字段，只有第一个线程拿到了初始值，其他线程都是默认值，让我能不能帮他解答一下，尼玛，我也不是神仙什么都懂，既然问了，那我试着帮他解答一下，也给后面类...【详细内容】

2024-01-26　　Search: 存储点击:(66)　　评论:(0)　　加入收藏

支付宝、微信有零钱时，切忌存储这3类照片

在日常生活中、工作中，对于手机中一些重要的照片，大家可能会时常拿出来使用，但殊不知，这种做法可能会在无形中对你造成不可挽回的损失！今天，笔者要说的话题，当你支付宝、微信中有零...【详细内容】

2024-01-19　　Search: 存储点击:(45)　　评论:(0)　　加入收藏

手机存储的奥秘：深入解析闪存技术的工作原理

手机存储的原理随着智能手机的普及，人们对于手机存储的需求越来越大。手机存储器的作用是存储用户数据和程序，以便在用户需要时读取或写入数据。本文将详细介绍手机存储的原理...【详细内容】