新浪微博应对日访问量百亿级的缓存架构设计

时间：2019-08-02 15:45:13 来源：作者：

微博日活跃用户1.6亿+，每日访问量达百亿级，面对庞大用户群的海量访问，良好的架构且不断改进的缓存体系具有非常重要的支撑作用。

本文大纲

1、 微博在运行过程中的数据挑战
2、 Feed平台系统架构
3、 Cache架构及演进
3、 总结与展望

数据挑战

数据挑战

Feed平台系统架构

Feed平台系统架构总共分为五层，最上面是端层，比如web端、客户端、大家用的IOS或Android/ target=_blank class=infotextkey>安卓的一些客户端，还有一些开放平台、第三方接入的一些接口；下一层是平台接入层，不同的池子，主要是为了把好的资源集中调配给重要的核心接口，这样遇到突发流量的时候，就有更好的弹性来服务，提高服务稳定性。再下面是平台服务层，主要是Feed算法、关系等等。接下来是中间层，通过各种中间介质提供一些服务。最下面一层就是存储层。

1、Feed Timeline

大家日常刷微博的时候，比如在主站或客户端点一下刷新，最新获得了十到十五条微博，这是怎么构建出来的呢？

刷新之后，首先会获得用户的关注关系。比如他有一千个关注，会把这一千个ID拿到，再根据这一千个UID，拿到每个用户发表的一些微博。同时会获取这个用户的Inbox，就是他收到的特殊的一些消息，比如分组的一些微博、群的微博、下面的关注关系、关注人的微博列表。

拿到这一系列微博列表之后进行集合、排序，拿到所需要的那些ID，再对这些ID去取每一条微博ID对应的微博内容。如果这些微博是转发过来的，它还有一个原微博，会进一步取原微博内容。通过原微博取用户信息，进一步根据用户的过滤词对这些微博进行过滤，过滤掉用户不想看到的微博。

根据以上步骤留下的微博，会再进一步来看，用户对这些微博有没有收藏、点赞，做一些flag设置，还会对这些微博各种计数，转发、评论、赞数进行组装，最后才把这十几条微博返回给用户的各种端。

这样看来，用户一次请求得到的十几条记录，后端服务器大概要对几百甚至几千条数据进行实时组装，再返回给用户，整个过程对Cache体系强度依赖，所以Cache架构设计优劣会直接影响到微博体系表现的好坏。

2、Feed Cache架构

接下来我们看一下Cache架构，它主要分为六层。首先第一层是Inbox，主要是分组的一些微博，然后直接对群主的一些微博。Inbox比较少，主要是推的方式。

然后对于第二层的Outbox，每个用户都会发常规的微博，都会在它的Outbox里面去。根据存的ID数量，实际上分成多个Cache，普通的大概是200多条，如果长的大概是2000条。

第三层是一些关系，它的关注、粉丝、用户。

第四层是内容，每一条微博一些内容存在这里。

第五层就是一些存在性判断，比如某条微博我有没有赞过。之前有一些明星就说我没有点赞这条微博怎么显示我点赞了，引发了一些新闻。而这种就是记录，实际上她有在某个时候点赞过但可能忘记了。

最下面还有比较大的一层——计数，每条微博的评论、转发等计数，还有用户的关注数、粉丝数这些数据。

Cache架构及演进

1、简单KV数据类型

接下来我们着重讲一下微博的Cache架构演进过程。最开始微博上线时，我们是把它作为一个简单的KV数据类型来存储。我们主要采取哈希分片存储在MC池子里，上线几个月之后发现一些问题：有一些节点机器宕机或是其它原因，大量的请求会穿透Cache层达到DB上去，导致整个请求变慢，甚至DB僵死。

于是我们很快进行了改造，增加了一个HA层，这样即便Main层出现某些节点宕机情况或者挂掉之后，这些请求会进一步穿透到HA层，不会穿透到DB层。这样可以保证在任何情况下，整个系统命中率不会降低，系统服务稳定性有了比较大的提升。

对于这种做法，现在业界用得比较多，然后很多人说我直接用哈希，但这里面也有一些坑。比如我有一个节点，节点3宕机了，Main把它给摘掉，节点3的一些QA分给其他几个节点，这个业务量还不是很大，穿透DB，DB还可以抗住。但如果这个节点3恢复了，它又加进来之后，节点3的访问就会回来，稍后节点3因为网络原因或者机器本身的原因，它又宕机了，一些节点3的请求又会分给其他节点。这个时候就会出现问题，之前分散给其他节点写回来的数据已经没有人更新了，如果它没有被剔除掉就会出现混插数据。

实际上微博是一个广场型的业务，比如突发事件，某明星找个女朋友，瞬间流量就30%了。突发事件后，大量的请求会出现在某一些节点，会导致这些节点非常热，即便是MC也没办法满足这么大的请求量。这时MC就会变成瓶颈，导致整个系统变慢。

基于这个原因，我们引入了L1层，还是一个Main关系池，每一个L1大概是Main层的N分之一，六分之一、八分之一、十分之一这样一个内存量，根据请求量我会增加4到8个L1，这样所有请求来了之后首先会访问L1。L1命中的话就会直接访问，如果没有命中再来访问Main-HA层，这样在一些突发流量的时候，可以由L1来抗住大部分热的请求。对微博本身来说，新的数据就会越热，只要增加很少一部分内存就会抗住更大的量。

简单总结一下，通过简单KV数据类型的存储，我们实际上以MC为主的，层内HASH节点不漂移，Miss穿透到下一层去读取。通过多组L1读取性能提升，能够抗住峰值、突发流量，而且成本会大大降低。对读写策略，采取多写，读的话采用逐层穿透，如果Miss的话就进行回写。对存在里面的数据，我们最初采用Json/xml，2012年之后就直接采用Protocol Buffer格式，对一些比较大的用QuickL进行压缩。

2、集合类数据

刚才讲到简单的QA数据，那对于复杂的集合类数据怎么来处理？

比如我关注了2000人，新增一个人，就涉及到部分修改。有一种方式是把2000个ID全部拿下来进行修改，但这种对带宽、机器压力会很大。还有一些分页获取，我存了2000个，只需要取其中的第几页，比如第二页，也就是第十到第二十个，能不能不要全量把所有数据取回去。还有一些资源的联动计算，会计算到我关注的某些人里面ABC也关注了用户D。这种涉及到部分数据的修改、获取，包括计算，对MC来说实际上是不太擅长的。

各种关注关系都存在redis里面取，通过Hash分布、储存，一组多存的方式来进行读写分离。现在Redis的内存大概有30个T，每天都有2-3万亿的请求。

在使用Redis的过程中，实际上还是遇到其他一些问题。比如从关注关系，我关注了2000个UID，有一种方式是全量存储，但微博有大量的用户，有些用户登陆得比较少，有些用户特别活跃，这样全部放在内存里成本开销是比较大的。所以我们就把Redis使用改成Cache，比如只存活跃的用户，如果你最近一段时间没有活跃，会把你从Redis里踢掉，再次有访问的时候再把你加进来。

这时存在一个问题，因为Redis工作机制是单线程模式，如果它加某一个UV，关注2000个用户，可能扩展到两万个UID，两万个UID塞回去基本上Redis就卡住了，没办法提供其他服务。所以我们扩展一种新的数据结构，两万个UID直接开了端，写的时候直接依次把它写到Redis里面去，读写的整个效率就会非常高。它的实现是一个long型的开放数组，通过Double Hash进行寻址。

我们对Redis进行了一些其他的扩展，大家可能也在网上看到过我们之前的一些分享，把数据放到公共变量里面，整个升级过程，我们测试1G的话加载要10分钟，10G大概要十几分钟以上，现在是毫秒级升级。

对于AOF，我们采用滚动的AOF，每个AOF是带一个ID的，达到一定的量再滚动到下一个AOF里去。对RDB落地的时候，我们会记录构建这个RDB时，AOF文件以及它所在的位置，通过新的RDB、AOF扩展模式，实现全增量复制。

3、其他数据类型-计数

接下来还有一些其他的数据类型，比如一个计数，实际上计数在每个互联网公司都可能会遇到，对一些中小型的业务来说，实际上MC和Redis足够用的，但在微博里计数出现了一些特点：单条Key有多条计数，比如一条微博，有转发数、评论数，还有点赞；一个用户有粉丝数、关注数等各种各样的数字。因为是计数，它的Value size是比较小的，根据它的各种业务场景，大概就是2-8个字节，一般4个字节为多，然后每日新增的微博大概十亿条记录，总记录就更可观了，然后一次请求，可能几百条计数要返回去。

4、计数器-Counter Service

最初是可以采取Memcached，但它有个问题，如果计数超过它内容容量时，会导致一些计数的剔除，宕机或重启后计数就没有了。另外可能有很多计数它为零，那这个时候怎么存，要不要存，存的话就占很多内存。微博每天上十亿的计数，光存0都要占大量的内存，如果不存又会导致穿透到DB里去，对服务的可溶性会存在影响。

2010年之后我们又采用Redis访问，随着数据量越来越大之后，发现Redis内存有效负荷还是比较低的，它一条KV大概需要至少65个字节，但实际上我们一个计数需要8个字节，然后Value大概4个字节，所以有效只有12个字节，还有四十多个字节都是被浪费掉的。这还只是单个KV，如果在一条Key有多个计数的情况下，它就浪费得更多了。比如说四个计数，一个Key 8个字节，四个计数每个计数是4个字节，16个字节大概需要26个字节就行了，但是用Redis存大概需要200多个字节。

后来我们通过自己研发的Counter Service，内存降至Redis的五分之一到十五分之一以下，而且进行冷热分离，热数据存在内存里，冷数据如果重新变热，就把它放到LRU里去。落地RDB、AOF，实现全增量复制，通过这种方式，热数据单机可以存百亿级，冷数据可以存千亿级。

整个存储架构大概是上图这样，上面是内存，下面是SSD，在内存里是预先把它分成N个Table，每个Table根据ID的指针序列，划出一定范围。任何一个ID过来先找到它所在的Table，如果有直接对它增增减减，有新的计数过来，发现内存不够的时候，就会把一个小的Table Dump到SSD里去，留着新的位置放在最上面供新的ID来使用。

有些人疑问说，如果在某个范围内，我的ID本来设的计数是4个字节，但是微博特别热，超过了4个字节，变成很大的一个计数怎么处理？对于超过限制的，我们把它放在Aux dict进行存放，对于落在SSD里的Table，我们有专门的IndAux进行访问，通过RDB方式进行复制。

5、其他数据类型-存在性判断

除了计数，微博还有一些业务，一些存在性判断。比如一条微博展现的，有没有点赞、阅读、推荐，如果这个用户已经读过这个微博了，就不要再显示给他。这种有一个很大的特点，它检查是否存在，每条记录非常小，比如Value1个bit就可以了，但总数据量巨大。比如微博每天新发表微博1亿左右，读的可能有上百亿、上千亿这种总的数据需要判断。怎么来存储是个很大的问题，而且这里面很多存在性就是0。还是前面说的，0要不要存？如果存了，每天就存上千亿的记录；如果不存，那大量的请求最终会穿透Cache层到DB层，任何DB都没办法抗住那么大的流量。

我们也进行了一些选型，首先直接考虑能不能用Redis。单条KV 65个字节，一个KV可以8个字节的话，Value只有1个bit，这样算下来每日新增内存有效率是非常低的。第二种我们新开发的Counter Service，单条KV Value1个bit，我就存1个byt，总共9个byt就可以了。这样每日新增内存900G，存的话可能就只能存最新若干天的，存个三天差不多快3个T了，压力也挺大，但比Redis已经好很多。

我们最终方案是自己开发Phantom，先采用把共享内存分段分配，最终使用的内存只用120G就可以。算法很简单，对每个Key可以进行N次哈希，如果哈希的某一个位它是1，那么进行3次哈希，三个数字把它设为1。把X2也进行三次哈希，后面来判断X1是否存在的时候，从进行三次哈希来看，如果都为1就认为它是存在的，如果某一个哈希X3，它的位算出来是0，那就百分百肯定是不存在的。

它的实现架构比较简单，把共享内存预先拆分到不同Table里，在里面进行开方式计算，然后读写，落地的话采用AOF+RDB的方式进行处理。整个过程因为放在共享内存里面，进程要升级重启数据也不会丢失。对外访问的时候，建Redis协议，它直接扩展新的协议就可以访问我们这个服务了。

6、小结

小结一下，到目前为止，我们关注了Cache集群内的高可用、扩展性、组件高性能，还有一个特别重要就是存储成本，还有一些我们没有关注到的，比如运维性如何，微博现在已经有几千差不多上万台服务器等。

7、进一步优化

8、服务化

采取的方案首先就是对整个Cache进行服务化管理，对配置进行服务化管理，避免频繁重启，另外如果配置发生变更，直接用一个脚本修改一下。

服务化还引入Cluster Manager，实现对外部的管理，通过一个界面来进行管理，可以进行服务校验。服务治理方面，可以做到扩容、缩容，SLA也可以得到很好的保障。另外，对于开发来说，现在就可以屏蔽Cache资源。

总结与展望

最后简单总结一下，对于微博Cache架构来说，我们从它的数据架构、性能、储存成本、服务化等不同方面进行了优化增强。欢迎对此有研究或有疑问的同行们留言，跟我们一起探讨。

如果您觉得文章对您有帮助，动动你的小指头，点亮一份陪护在你身边的灯烛，共勉共励。

Tags：点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

聊聊如何自定义数据脱敏

前言什么是数据脱敏数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形，实现敏感隐私数据的可靠保护常用脱敏规则替换、重排、加密、截断、掩码良好的数据脱敏实施1、尽...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

河南人到底有多爱吃面？盘点河南13大名面，看看你都吃过哪几种？

河南最有名的“13碗面”，吃过10种以上的一定是地道河南人，你吃过几碗？河南位于黄河中下游，优越的地理位置和条件，让河南的种植业在全国脱颖而出，被称为全国的“粮仓”。小麦是河南...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

人称“犬中四煞”的4种狗，请认住它们的长相，看见了要绕路走

在狗界中，有些狗狗比较凶残、霸道，今天我们就来说说被称为“犬中四煞”的4种狗，请认住它们的长相，看见了要绕路走！ NO1：黑狼犬产地：中国寿命：11-12年黑狼犬是狼狗的一种，长大高大威猛...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

离婚后，约定每月给孩子7000元抚养费，前夫却以再婚再育等为由想少给钱，法院这样判

协议下的体面离婚 2015年1月方晴供职于一家外企，袁亮硕士毕业后开了家公司。两人相识、恋爱后走进婚姻殿堂。方晴和袁亮的儿子小浩出生了。本该是其乐融融的三口之家，却在一...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(2)　　评论:(0)　　加入收藏

“三皇五帝”分别是哪三皇，哪五帝？

中国人神话世界五千年到一万年之前到底是一个什么样的世界？相信这个问题应该是困扰了大家许久吧！其实这些问题可以从远古时代的三皇五帝开始说起，三皇五帝对于中国人的影响就如...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(2)　　评论:(0)　　加入收藏

印度低种姓群体如何翻身？途径确实有，但操作难度大

去年有个新闻，说的是一名印度女孩自小被欧洲有钱人家收养，长大后要回来给自己出生的村子捐钱做慈善。等她回村的时候，村里人专门为女孩修了一条路。表面上看，这貌似是个暖心的故...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

日本研发“飞行摩托”，售价高达435万人民币，远销我国你会买吗

日本在今年又给大家带来了一个巨大消息，日本著名的球星本田圭佑出资设立的一家公司，正式发售了飞行摩托车。在之前可是在电视或者是电影中才能看到的，是具备了未来科幻的一个...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(4)　　评论:(0)　　加入收藏

2021年Steam最畅销游戏榜单公布

V社今日公布了2021年Steam最畅销游戏榜单，其中涵盖了本年度Steam上收入最高的100款游戏。为了得出每款游戏的总收入，Steam计算了2021年1月1日至2021年12月15日的游戏销售额、...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

转移公司资金是挪用还是侵占

“都怪我一时糊涂铸下大错，这几年为了蒙混过关，拆东墙补西墙就怕被发现，我对不起信任我的领导同事，更对不起我的家人。”内蒙古某国有合资公司原出纳员包某在庭审现场听取公诉人...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(2)　　评论:(0)　　加入收藏

黄金和白银价格2022年度走势展望，纸白银后续怎么看？

2021年黄金价格下跌11.3%，黄金现在已经下跌了6.5%。白银价格一度下跌19.3%，白银现在已经下跌了15%。美元通胀。白银自2020年2月份以来，五家中央银行（Fed、欧洲中央银行、日本中...【详细内容】

2021-12-28　　Tags: 新浪微博缓存架构点击:(3)　　评论:(0)　　加入收藏

▌简易百科推荐

架构师才需要知道的知识：如何做容量预估和调优

为了构建高并发、高可用的系统架构，压测、容量预估必不可少，在发现系统瓶颈后，需要有针对性地扩容、优化。结合楼主的经验和知识，本文做一个简单的总结，欢迎探讨。1、QPS保障目标...【详细内容】

2021-12-27　　大数据架构师　　　　Tags:架构　点击:(5)　　评论:(0)　　加入收藏

嵌入式程序架构--你了解多少？

前言单片机开发中，我们往往首先接触裸机系统，然后到RTOS，那么它们的软件架构是什么?这是我们开发人员必须认真考虑的问题。在实际项目中，首先选择软件架构是非常重要的，接下来我...【详细内容】

2021-12-23　　正点原子原子哥　　　　Tags:架构　点击:(7)　　评论:(0)　　加入收藏

我们需要一次怎样的数据架构变革？

现有数据架构难以支撑现代化应用的实现。随着云计算产业的快速崛起，带动着各行各业开始自己的基于云的业务创新和信息架构现代化，云计算的可靠性、灵活性、按需计费的高性价...【详细内容】

2021-12-22　　　　CSDN　　Tags:数据架构　点击:(10)　　评论:(0)　　加入收藏

微服务项目到底如何分模块？

▶ 企业级项目结构封装释义如果你刚毕业，作为Java新手程序员进入一家企业，拿到代码之后，你有什么感觉呢？如果你没有听过多模块、分布式这类的概念，那么多半会傻眼。为什么一个项...【详细内容】

2021-12-20　　蜗牛学苑　　　　Tags:微服务　点击:(9)　　评论:(0)　　加入收藏

开源的springboot+thymeleaf后台架构，程序员用了都点赞

我是一名程序员关注我们吧，我们会多多分享技术和资源。进来的朋友，可以多了解下青锋的产品，已开源多个产品的架构版本。Thymeleaf版（开源）1、采用技术： springboot、layui、Thymel...【详细内容】

2021-12-14　　青锋爱编程　　　　Tags:后台架构　点击:(21)　　评论:(0)　　加入收藏

长链接、短链接与连接池

在了解连接池之前，我们需要对长、短链接建立初步认识。我们都知道，网络通信大部分都是基于TCP/IP协议，数据传输之前，双方通过“三次握手”建立连接，当数据传输完成之后，又通过“四次挥手”释放连接，以下是“三次握手”与“四...【详细内容】

2021-12-14　　架构即人生　　　　Tags:连接池　点击:(17)　　评论:(0)　　加入收藏

分布式系统 Etcd 解析

随着移动互联网技术的快速发展，在新业务、新领域、新场景的驱动下，基于传统大型机的服务部署方式，不仅难以适应快速增长的业务需求，而且持续耗费高昂的成本，从而使得各大生产厂商...【详细内容】

2021-12-08　　架构驿站　　　　Tags:分布式系统　点击:(23)　　评论:(0)　　加入收藏

阿里架构师整理的 Netty 学习笔记之：Java NIO 网络编程

本系列为 Netty 学习笔记，本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架，也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层...【详细内容】

2021-12-07　　大数据架构师　　　　Tags:Netty 　点击:(17)　　评论:(0)　　加入收藏

传统IT架构转型，从云原生平台到微服务应用构建

前面谈过很多关于数字化转型，云原生，微服务方面的文章。虽然自己一直做大集团的SOA集成平台咨询规划和建设项目，但是当前传统企业数字化转型，国产化和自主可控，云原生，微服务是不...【详细内容】

2021-12-06　　人月聊IT　　　　Tags:架构　点击:(23)　　评论:(0)　　加入收藏

放弃微服务，构建单体应用

微服务看似是完美的解决方案。从理论上来说，微服务提高了开发速度，而且还可以单独扩展应用的某个部分。但实际上，微服务带有一定的隐形成本。我认为，没有亲自动手构建微服务的经历，就无法真正了解其复杂性。...【详细内容】

2021-11-26　　GreekDataGuy　　CSDN　　Tags:单体应用　点击:(35)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游

推荐一款nginx+redis+ehcache高并发与高可用缓存架构