MySQL数据迁移到TiDB的流程及为何放弃MyCat

时间：2021-03-05 11:04:56 来源：作者：

背景

TiDB 是一个分布式关系型数据库，可以无缝对接 MySQL。考虑到产品数据量大的情况下，单机 MySQL 可能无法支撑，而无缝切换到 TiDB 集群也比较方便，所以领导让我调研了一天迁移过程。

本文将记录使用 mydumper 工具导出 MySQL 数据库数据，并使用 TiDB Lightning 将数据迁移到 TiDB 集群的流程。对比以前部署测试 MyCat 时的经历，发现 TiDB 迁移时不需要配置分库分表规则，迁移过程更方便，对得起“无缝”二字！

第一步，部署 TiDB Lightning

TiDB Lightning 部署包是一个压缩文件，解压后可直接使用，部署流程非常简单：

（一）确定 TiDB 版本

用 MySQL 客户端连接到 TiDB 集群后，执行 select version() 语句得到版本号：

（二）下载工具包

根据版本号，确定下载连接：https://download.pingcap.org/tidb-toolkit-{version}-linux-amd64.tar.gz 替换为具体的版本号后的地址。

下载文件：

wget  https://download.pingcap.org/tidb-toolkit-v4.0.0-linux-amd64.tar.gz

（三）解压

进入部署包所在目录，解压：

tar -xzf tidb-toolkit-v4.0.0-linux-amd64.tar.gz

进入解压后的 bin 目录，查看它提供的工具：

mydumper 和 tidb-lightning 就是一对导出、导入工具，其中 mydumper 跟 MySQL 的 mysqldump 功能是一样的。

但是据我测试导出 3.9G 的数据耗时来看，mydumper 比 mysqldump 快很多。

建议使用 mydumper，原因是用它导出的数据时，会自动创建 xxx-schema-create.sql 建库文件，而且建表和插入 SQL 文件分开，不用额外操作，配套用 tidb-lightning 执行导入，不容易出错。

如果用 mysqldumper 则需要注意导出建库语句，是否需要添加 use database 之类的语句，用 MySQL 的 source 导入时容易出现的问题，都需要注意。不是配套的工具，这种方式没有测试过。

第二步，导出 MySQL 数据

进入 bin 目录，用 mydumper 工具，连接到目标数据库上导出，命令如下：

./mydumper -h  IP -P 3306 -u root -p 123456 -t 16 -F 128 -B targetDatabase -o /tidb-data/mydumpersql/

参数说明：

-B， --database 需要备份的数据库
-t，–threads 备份执行的线程数，默认4个线程
-F，–chunk-filesize 行块分割表的文件大小，单位是MB
-o，–outputdir 备份文件目录

注意，最后一个 outputdir 的值，后面导入的时候需要使用。因为使用多线程，所以就不难理解为何它的效率会比 mysqldumper 高了。

第三步，导入 TiDB 集群

最后一步，利用 tidb-lightning 工具将第二步导出的数据，导入到 TiDB 集群中。

官网的操作流程不是很清楚，而且给出的 tidb-lightning 里面有一项配置对 4.0.0 版本来说会报错，这里提供纠正后的完整配置。

（一）创建配置文件

在 bin 目录下创建一个配置文件 tidb-lightning.toml【文件名称任意】，并打开：

touch tidb-lightning.toml
vi tidb-lightning.toml

写入如下配置信息：

[lightning]

# 转换数据的并发数，默认为逻辑 CPU 数量，不需要配置。
# 混合部署的情况下可以配置为逻辑 CPU 的 75% 大小。
# region-concurrency =

# 日志
level = "info"
file = "tidb-lightning.log"

[tikv-importer]
# backend 设置为 local 模式
backend = "tidb"
# 设置本地临时存储路径
# sorted-kv-dir = "/mnt/ssd/sorted-kv-dir"

[mydumper]
# Mydumper 源数据目录。
data-source-dir = "/tidb-data/mydumpersql"

[tidb]
# 目标集群的信息。tidb-server 的监听地址，填一个即可。
host = "192.168.xxx.xxx"
port = 4000
user = "root"
password = "root"
# 表架构信息在从 TiDB 的“状态端口”获取。
status-port = 10080
# pd-server 的地址，填一个即可
# pd-addr = "192.168.xxx.xxx:2379"

说明：

data-source-dir 就是第二步导出时 -o 的参数值；
host 是 TiDB 集群地址和端口；
sorted-kv-dir 这个配置不支持，放开后会报错：unknown configuration options: tikv-importer.sorted-kv-dir。
pd-addr 这个配置没啥用，去掉也不影响导入

（二）执行导入命令

由于数据库全量导入，操作耗时较长，官方建议将导入命令封装成脚本。

先在 bin 目录下创建一个 loaddata.sh 文件，内容如下：

#!/bin/bash
nohup ./tidb-lightning -config ./tidb-lightning.toml > nohup.out &

执行脚本，然后查看 TiDB 的集群日志 tidb.log ，查看导入进度。

导入完成后，用 MySQL 客户端连接到 TiDB 集群的一个主机，查看数据。

启示录

将 MySQL 数据迁移到 TiDB 的过程，直接参考官方文档进行操作就可以了。但是，涉及到 tidb-lightning 工具的那一章节，内容跟数据迁移章节有一些看不懂，其中涉及到 tikv-importer，它和 tidb-lightning 的关系没有详细说明，还有一些配置项会导致导入报错。

实践证明，只用 tidb-lightning 工具就可以完成数据迁入过程。

去年 8 月份调研过 MyCat 集群，由于它的分片分库规则比较复杂，而目前这个产品涉及的表比较多，而且很多都是动态创建的，所以只做了技术调研，一直没有技术落地。

MyCat 和 TiDB 都不会对应用端代码产生影响，JDBC 连接只需要修改 IP 和端口就好，几乎没有工作量。库表迁移就不一样了，TiDB 可以直接迁移。

MyCat 由于 Schema 和表创建涉及到分库分表策略，需要自己设计数据分布规则，当初也只是简单写了一个生成配置的小程序，不敢保证能够数据能够无缝正确迁移。

Tags：MySQL数据迁移点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

MySQL数据迁移到TiDB的流程及为何放弃MyCat

背景TiDB 是一个分布式关系型数据库，可以无缝对接 MySQL。考虑到产品数据量大的情况下，单机 MySQL 可能无法支撑，而无缝切换到 TiDB 集群也比较方便，所以领导让我调研了一天迁移...【详细内容】

2021-03-05　　Tags: MySQL数据迁移点击:(274)　　评论:(0)　　加入收藏

▌简易百科推荐

MySQL 使用 Mysqldump 备份导入数据导致主从异常

作者：雷文霆爱可生华东交付服务部 DBA 成员，主要负责Mysql故障处理及相关技术支持。爱好看书，电影。座右铭，每一个不曾起舞的日子，都是对生命的辜负。本文来源：原创投稿 *爱可生...【详细内容】

2021-12-24　　爱可生　　　　Tags:MySQL 　点击:(6)　　评论:(0)　　加入收藏

分享MySQL记录锁、间隙锁、临键锁小案例演示，你学废了吗

生成间隙(gap)锁、临键(next-key)锁的前提条件是在 RR 隔离级别下。有关Mysql记录锁、间隙(gap)锁、临键锁(next-key)锁的一些理论知识之前有写过，详细内容可以看这篇文章...【详细内容】

2021-12-14　　python数据分析　　　　Tags:MySQL记录锁　点击:(17)　　评论:(0)　　加入收藏

mysqlbinlog基本认识

binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了，它记录了所有的DDL和DML(除了数据查询语句)语句，以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二...【详细内容】

2021-12-14　　linux上的码农　　　　Tags:mysql 　点击:(13)　　评论:(0)　　加入收藏

百万级数据下的mysql深度解析

为查询优化你的查询大多数的MySQL服务器都开启了查询缓存。这是提高性最有效的方法之一，而且这是被MySQL的数据库引擎处理的。当有很多相同的查询被执行了多次的时候，这些查...【详细内容】

2021-12-09　　元宇宙iwemeta　　　　Tags:mysql 　点击:(15)　　评论:(0)　　加入收藏

Mysql数据库tinyint，int，bigint，char，varchar究竟用哪个？

测试的目的和原因，公司有很多程序员，每个程序员对数据库和表结构都有自己的理解。而且每个程序员的理解往往是以效率考虑。既然都是为了效率考虑，那么我就来测试一下究竟哪种使...【详细内容】

2021-12-08　　吴彬的分享　　　　Tags:Mysql数据库　点击:(14)　　评论:(0)　　加入收藏

Win下部署多个MySQL数据库实例

当你们考虑项目并发的时候，我在部署环境，当你们在纠结使用ArrayList还是LinkedArrayList的时候，我还是在部署环境。所以啊，技术不止境，我在部环境。今天这篇文章缕一下在同一台服...【详细内容】

2021-12-08　　秃头码哥　　　　Tags:MySQL数据库　点击:(16)　　评论:(0)　　加入收藏

MySQL中常用的15个查询子句

对于数据分析来说，MySQL使用最多的是查询，比如对数据进行排序、分组、去重、汇总及字符串匹配等，如果查询的数据涉及多个表，还需要要对表进行连接，本文就来说说MySQL中常用的查询...【详细内容】

2021-12-06　　笨鸟学数据分析　　　　Tags:MySQL 　点击:(19)　　评论:(0)　　加入收藏

15个MySQL常用基本SQL语句

在学习SQL语句之前，首先需要区分几个概念，我们常说的数据库是指数据库软件，例如MySQL、Oracle、SQL Server等，而本文提到的数据库是指数据库软件中的一个个用于存储数据的容器。...【详细内容】

2021-11-24　　笨鸟学数据分析　　　　Tags:SQL语句　点击:(23)　　评论:(0)　　加入收藏

用 MySQL 实现分布式锁，你听过吗？

概述以前参加过一个库存系统，由于其业务复杂性，搞了很多个应用来支撑。这样的话一份库存数据就有可能同时有多个应用来修改库存数据。比如说，有定时任务域xx.cron，和SystemA域...【详细内容】

2021-11-05　　Java云海　　　　Tags:分布式锁　点击:(31)　　评论:(0)　　加入收藏

MySQL高级SQL语句

MySQL的进阶查询一、按关键字排序使用ORDERBY语句来实现排序排序可针对一个或多个字段ASC:升序，默认排序方式【升序是从小到大】DESC:降序【降序是从大到小】ORDER BY的...【详细内容】

2021-11-05　　Java热点　　　　Tags:SQL语句　点击:(27)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为

无相关信息