什么是分布式SQL

时间：2019-12-16 13:50:32 来源：作者：

本文向您介绍分布式SQL的基本概念，其对应的数据库架构，以及对于业务应用的各种优势。

作者：陈峻编译来源：51CTO

【51CTO.com快译】在过去的近40年中，SQL已经成为了关系型数据库(又称为RDBMS)的通用语言。这也就是为什么关系型数据库经常被简单称为SQL数据库的原因。从架构而言，以Oracle、PostgreSQL和MySQL为首的传统SQL数据库，是单体式(monolithic)的。也就是说，它们无法在多个实例之间自动地分配数据和查询。而NewSQL数据库的出现使得SQL具有了可扩展性和高性能。当然，此类数据库仍然具有与生俱来的局限性。

2015年，Docker容器和Kubernetes编排的出现，让我们能够以灵活、可组合的基础架构方式，来创建各种基于微服务的应用。其中，内置的可扩容性、灵活性、以及地理分布特性，是此类云原生架构的核心特点。这也就是人们常说的“分布式SQL”--这一新型的数据库。在应用方面，此类分布式SQL数据库的一个显著特征是：无论其中有多少个节点，整个数据库集群对于应用程序而言，都被其视为一个逻辑的SQL数据库。

数据库的架构

分布式SQL数据库通常具有如下三层体系结构。

1. SQL API

顾名思义，分布式SQL数据库仍然必须提供SQL API服务，以便应用程序可以对关系型数据进行建模，并执行涉及到各种关系信息的查询操作。它保留了SQL数据库典型的数据建模结构，包括：索引、外键约束、JOIN查询、以及多行ACID事务(译者注：原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability))。

2.分布式查询执行

由于分布式SQL的查询能够被自动地分配到目标群集的多个节点上，因此，此举有效地避免了单个节点成为查询处理中的瓶颈问题。具体的查询流程为：目标群集中的任一节点都可以接受传入的某个查询。通过在网络中的各节点之间传输数据、协同工作，该节点能够以最小化处理等待时间的方式，仅分担查询请求中的一部分任务。而由其他节点协助完成剩余的部分。最后，该接受请求的原始节点，将汇总所有的查询结果，并发回给客户端应用程序。

3.分布式数据存储

那些包含有索引信息的数据会被自动分布(也称为分片，sharded)到群集的多个节点处。此举确保了单个节点都不会成为高性能和高可用性的瓶颈。此外，数据库集群能够支持高一致性的复制、以及多行(也称为分布式)ACID事务，进而保留了单个逻辑数据库的基本概念。

高度一致性的复制

在数据库的管理概念中，所谓支持强大的SQL API层，其本质上就是要求处于底层的存储层，能够在跨数据库的群集节点上建立强一致性的复制。这就意味着：对于数据库的写入操作，将会在多个节点上被同步提交，以保证出现故障时的数据可用性。而读取操作则是基于最后一次被提交的写入数据，或是出错之前的数据。该属性通常被称为线性一致性(Linearizability，http://www.bailis.org/blog/linearizability-versus-serializability/)。根据著名的CAP原则(https://towardsdatascience.com/cap-theorem-and-distributed-database-management-systems-5c2be977950e，译者注：一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance))，分布式SQL数据库具有一致性和分区容错性。

分布式的ACID事务

为了能够支持分布式的ACID事务，分布式数据库的存储层需要在多个节点的多个数据行中进行事务性的协调任务。此处，它们正好用到了两阶段提交(2 Phase Commit，2PC)协议。参照ACID中I(隔离性)的要求，为了能够对并发式的数据访问实现严格的隔离，分布式SQL数据库将可序列化性(Serializability，http://www.bailis.org/blog/linearizability-versus-serializability/)作为最严格的隔离级别，并且通过快照(Snapshot)之类的其他方式来支持较弱的隔离级别。

业务应用的优势

分布式SQL的四个关键优势，如下图所示。

1.让SQL和事务类的开发更具敏捷性

如今，由于SQL仍然是一种轻松实现建模关系和多行操作的数据建模语言，因此为了满足应用开发人员持续对于SQL数据库的操作习惯与需求，即便是Amazon DynamoDB、MongoDB和FaunaDB之类的NoSQL数据库，也开始具备了事务性的操作能力。例如：SQL通过显式(使用BEGIN和END TRANSACTION的语法)和隐式(使用外键和JOIN查询之类的二级索引)，来允许多行事务，这比传统的键-值(key-value)型NoSQL要方便得多。

此外，开发人员往往喜欢通过一次性轻松地使用SQL，来对数据(和存储)进行建模。而在业务需求发生变化时，他们只需修改JOIN，便可反映到查询之中。

2.具有本地故障转移与修复的超强弹性

在分布式SQL数据库中，我们使用基于分片(per-shard)的分布式共识复制(consensus replication)等技术，来确保每个分片(而不是每个实例)在出现故障时，仍可保持高可用性。

如此，基础架构一旦出现故障，它始终只会影响到目标数据的某个子集(也就是那些被leader分割开的碎片)，而不会影响到整个集群。并且，由于剩余的分片副本能够在几秒钟之内自动地选出新的leader，因此，集群会在出现故障时表现出一定的自我修复能力。

此外，这些发生在后台群集配置上的更改对于应用程序来说是完全透明的，它们可以照常运行，而不会出现任何中断或是性能的骤降。

3.具有按需进行水平写入的可扩展性

《如何在分布式SQL数据库中进行数据分片》一文(https://dzone.com/articles/how-data-sharding-works-in-a-distributed-sql-datab)，说明了开发人员通常是如何在分布式SQL数据库中实现自动化数据分片的。无论有新节点的加入，还是现有节点的删除，分片都将会在所有可用节点之间保持自动的平衡状态。

目前，那些需要处理事务的应用程序都具有可扩展能力的微服务。它们在不需要新增基础架构的基础上，完全可以直接依赖于内存中的缓存(无需从数据库中读取请求，而保留对于写入请求的处理)或NoSQL数据库(虽然能够扩展写入操作，但是无法保证ACID)。

4.针对地域分布式数据的低延迟性

正如《构建具有低延迟的云原生、以及地域分布式SQL应用的9种技术》一文(https://dzone.com/articles/9-techniques-to-build-cloud-native-geo-distributed)所强调的那样：分布式SQL数据库可以提供多种技术，来构建地域分布式的应用程序。这些技术不仅有助于对于区域性故障实现自动化容灾，而且还能够在一定程度上通过让数据更接近来自本区域的最终用户，以实现更低的数据延迟性。

原文标题：What Is Distributed SQL? ，作者：Sid Choudhury

Tags：分布式SQL 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

分布式SQL大数据查询引擎的发展

基于SQL的查询引擎简介，包括指向数据仓库和数据湖的链接> Photo by NASA on Unsplash介绍从高层的角度来看，许多数据和分析解决方案已经以相同的方式构建了许多年。简而言之，...【详细内容】

2020-11-26　　Tags: 分布式SQL 点击:(165)　　评论:(0)　　加入收藏

什么是分布式SQL

本文向您介绍分布式SQL的基本概念，其对应的数据库架构，以及对于业务应用的各种优势。...【详细内容】

2019-12-16　　Tags: 分布式SQL 点击:(110)　　评论:(0)　　加入收藏

▌简易百科推荐

SQL常用增删改查语句

1增1.1【插入单行】insert [into] <表名> (列名) values (列值)例：insert into Strdents (姓名,性别,出生日期) values ('开心朋朋','男','1980/6/15&#3...【详细内容】

2021-12-27　　快乐火车9d3　　　　Tags:SQL 　点击:(2)　　评论:(0)　　加入收藏

以一个简单的查询存储过程为例，简单说一下sql的几种写法

最近发现还有不少做开发的小伙伴，在写存储过程的时候，在参考已有的不同的写法时，往往很迷茫，不知道各种写法孰优孰劣，该选用哪种写法，以及各种写法的优缺点，本文以一个简单的查询...【详细内容】

2021-12-23　　linux上的码农　　　　Tags:sql 　点击:(9)　　评论:(0)　　加入收藏

HasorDB 一个全功能数据库访问工具

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目，包括技术、学习、实用与各种有趣的内容。本期推荐的HasorDB 是一个全功能数据库访问工具，提供对象映射、丰...【详细内容】

2021-12-22　　GitHub精选　　　　Tags:HasorDB 　点击:(5)　　评论:(0)　　加入收藏

一文详解Liquibase如何自动化数据库脚本部署

作者丨Rafal Grzegorczyk译者丨陈骏策划丨孙淑娟【51CTO.com原创稿件】您是否还在手动对数据库执行各种脚本?您是否还在浪费时间去验证数据库脚本的正确性?您是否还需要将...【详细内容】

2021-12-22　　　　51CTO　　Tags:Liquibase 　点击:(4)　　评论:(0)　　加入收藏

SQL 中 on 和 where 条件放置的差异

场景描述：由于生产环境的表比较复杂，字段很多。这里我们做下简化，只为说明今天要聊的问题。有两张表 tab1，tab2： tab1 数据如下： tab2 数据如下：然后给你看下，我用来统计 name=&#3...【详细内容】

2021-12-20　　Bald　　　　Tags:SQL 　点击:(7)　　评论:(0)　　加入收藏

一文掌握SQL基础

前言知识无底，学海无涯，知识点虽然简单，但是比较多，所以将MySQL的基础写出来，方便自己以后查找，还有就是分享给大家。一、SQL简述1.SQL的概述Structure Query Language(结构化查...【详细内容】

2021-12-16　　谣言止于独立思考　　　　Tags:SQL基础　点击:(13)　　评论:(0)　　加入收藏

做测试不会 SQL？超详细的 SQL 查询语法教程来啦

前言作为一名测试工程师，工作中在对测试结果进行数据比对的时候，或多或少要和数据库打交道的，要和数据库打交道，那么一些常用的 SQL 查询语法必须要掌握。最近有部分做测试小伙...【详细内容】

2021-12-14　　柠檬班软件测试　　　　Tags:SQL 　点击:(15)　　评论:(0)　　加入收藏

C｜数据存储地址与字节偏移、数据索引

话说C是面向内存的编程语言。数据要能存得进去，取得出来，且要考虑效率。不管是顺序存储还是链式存储，其寻址方式总是很重要。顺序存储是连续存储。同质结构的数组通过其索引表...【详细内容】

2021-12-08　　小智雅汇　　　　Tags:数据存储　点击:(18)　　评论:(0)　　加入收藏

数据库迁移有什么技巧？|分享强大的database迁移和同步工具

概述DBConvert Studio 是一款强大的跨数据库迁移和同步软件，可在不同数据库格式之间转换数据库结构和数据。它将成熟、稳定、久经考验的 DBConvert 和 DBSync 核心与改进的现...【详细内容】

2021-11-17　　雪竹聊运维　　　　Tags:数据库　点击:(26)　　评论:(0)　　加入收藏

谈谈执行一条SQL的流程

一、前言大家好,我是小诚,《从0到1-全面深刻理解MySQL系列》已经来到第四章,这一章节的主要从一条SQL执行的开始,由浅入深的解析SQL语句由客户端到服务器的完整执行流程,最...【详细内容】

2021-11-09　　woaker　　　　Tags:SQL 　点击:(35)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游

无相关信息