5分钟学linux命令之split

时间：2019-09-24 10:05:27 来源：作者：

情景介绍

平时工作中，我习惯使用rz从本地上传文件到服务器，sz从服务器下载文件到本地，但对传输文件大小有限制，例如排查线上jvm的问题，需要生成了dump文件，可能有10G大，超过了限制，怎么下载呢？

拆分文件命令之split

语法

split [-<行数>][-l<行数>][-b<字节>][-C<字节>][要切割的文件][输出文件名的前缀][-a<后缀长度>]

- 或-l ：指定每多少行切成一个小文件行数> 行数>

-b ：指定每多少字节切成一个小文件，这里也可以指定K、M、G等单位字节>

-C ：与-b 类似，但在切割时会尽量维持每行的完整性字节> 字节>

输出文件名的前缀：设置拆分后文件的名称前缀，split会自动在前缀后面加上编号，默认从aa开始

-a ：默认后缀长度是2，即按 aa，ab，ac的顺序排序后缀长度>

split命令和cat命令可以完成上面的难题，排查线上问题的现场已经没有了，所以为了演示，用dd命令（对dd命令不了解的也可以学下，因为这次重点介绍split，所以dd暂且不介绍）创建一个400MB的文件，文件名是adsearch.hprof，这里假设400MB的大小就超过了服务器的下载限制

dd if=/dev/zero bs=1024 count=409600 of=adsearch.hprof

如图所示，创建了一个400MB的文件

那我把adsearch.hprof文件按100MB大小拆分，可以拆分成4个文件

split -b 100M adsearch.hprof

可以看到在执行完split命令后，目录下生成了四个相同大小 xaa、xab、xac、xad四个100MB的小文件。因为我们没有指定前缀，就采用了默认的前缀x，后面跟着aa、ab、ac、ad。我们也可以指定前缀，比如我把刚刚生成的四个小文件删掉，用下面的命令重新切分下

split -b 100M adsearch.hprof adsearch-

合并文件之cat

把大文件切分后，我们就可以把小文件下载到本地，然后把他们再拼接起来

// 用通配符的形式，要保证该目录下没有其他以adsearch-a为前缀的文件

cat adsearch-a* > adsearch.hprof

// 或者指定文件进行拼接

cat adsearch-aa adsearch-ab adsearch-ac adsearch-ad > adsearch.hprof

备注

上面的操作我是在win本上的gitbash操作的，有cat命令

那如果没有安装gitbash只有cmd呢？

可以使用copy /b 命令来拼接，其中 /b 代表指定以二进制格式进行复制

copy /b adsearch-aa + adsearch-ab + adsearch-ac + adsearch-ad adsearch.hprof

校验

经过拆分-合并后，两个文件一样吗？这是我们主要关心的问题，我们对文件做一个md5，看结果是否相等，就可以判断文件是否一样了

原始文件的md5

合并后文件的md5（gitbash）

合并后文件的md5（cmd）

经过对前后文件的md5值比价，结果一致，说明我们的操作没有问题

小结

当我们下载或上传相对较大的文件时，可以使用split把大文件拆分成小文件，然后用cat命令把这些小文件重新拼接成大文件

Tags：linux split 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

5分钟学linux命令之split

平时工作中，我习惯使用rz从本地上传文件到服务器，sz从服务器下载文件到本地，但对传输文件大小有限制，例如排查线上jvm的问题，需要生成了dump文件，可能有10G大，超过了限制，怎么下载呢？...【详细内容】

2019-09-24　　Tags: linux split 点击:(137)　　评论:(0)　　加入收藏

▌简易百科推荐

linux du命令

作用显示文件或目录所占用的磁盘空间使用命令格式du [option] 文件/目录命令功能显示文件或目录所占用的磁盘空间一些写法的区别du -sh xxx 显示总目录的大小，但是不会列出...【详细内容】

2021-12-23　　mitsuhide1992　　　　Tags:du命令　点击:(12)　　评论:(0)　　加入收藏

什么是linux内核？linux内核模块是什么？内核模块详解

什么是linux内核linux就像是一个哲学的最佳实践。如果非要对它评价，我真的不知道该怎么赞叹，我只能自豪地说着：“linux的美丽简直让人沉醉。”我只能说是我处在linux学习的修炼...【详细内容】

2021-12-23　　linux上的码农　　　　Tags:linux内核　点击:(15)　　评论:(0)　　加入收藏

Linux中 service 和 systemctl 命令比较

本文将比较 Linux 中 service 和 systemctl 命令，先分别简单介绍这两个命令的基础用法，然后进行比较。从 CentOS 7.x 开始，CentOS 开始使用 systemd 服务来代替 service服务（dae...【详细内容】

2021-12-23　　软件架构　　　　Tags:systemctl 　点击:(14)　　评论:(0)　　加入收藏

Linux之mv命令

mv是move的缩写,可以用来移动文件或者重命名文件名,经常用来备份文件或者目录。命令格式mv [选项] 源文件或者目录目标文件或者目录命令功能mv命令中第二个参数类型的不同（...【详细内容】

2021-12-17　　入门小站　　　　Tags:mv命令　点击:(23)　　评论:(0)　　加入收藏

Linux sed命令

大数据技术AI Flink/Spark/Hadoop/数仓，数据分析、面试，源码解读等干货学习资料 98篇原创内容 -->公众号 Linux sed 命令是利用脚本来处理文本文件。sed 可依照脚本的指令来处...【详细内容】

2021-12-17　　仙风道骨的宝石骑士　　　　Tags:sed命令　点击:(22)　　评论:(0)　　加入收藏

node是什么？如何在linux下安装node？

Node是个啥？　　写个东西还是尽量面面俱到吧，所以有关基本概念的东西我也从网上选择性地拿了下来，有些地方针对自己的理解有所改动，对这些概念性的东西有过了解的可选择跳过这段...【详细内容】

2021-12-15　　linux上的码农　　　　Tags:node 　点击:(25)　　评论:(0)　　加入收藏

ubuntu16.04 unity桌面设置攻略

难道只有我一个人觉得Ubuntu的unity桌面非常好用吗？最近把台式机上面的Ubuntu 16.04格式化了，装了黑苹果用了一周，不得不说，MacOS确实很精美，软件生态比Linux丰富很多，比Windows简...【详细内容】

2021-12-14　　地球末日村　　　　Tags:ubuntu 　点击:(41)　　评论:(0)　　加入收藏

Linux netstat命令详解

简介Netstat 命令用于显示各种网络相关信息，如网络连接，路由表，接口状态 (Interface Statistics)，masquerade 连接，多播成员 (Multicast Memberships) 等等。输出信息含义执行net...【详细内容】

2021-12-13　　窥镜天　　　　Tags:Linux netstat 　点击:(28)　　评论:(0)　　加入收藏

从Linux源码角度看Epoll，透过现象看本质

对于较多数量的文件描述符的监听无论是select还是poll系统调用都显得捉襟见肘，poll每次都需要将所有的文件描述符复制到内核，内核本身不会对这些文件描述符加以保存，这样的设计...【详细内容】

2021-12-13　　深度Linux　　　　Tags:Linux 　点击:(19)　　评论:(0)　　加入收藏

Linux eBPF解析

今天，我们来了解下 Linux 系统的革命性通用执行引擎-eBPF，之所以聊着玩意，因为它确实牛逼，作为一项底层技术，在现在的云原生生态领域中起着举足轻重的作用。截至目前，业界使用范...【详细内容】

2021-12-10　　架构驿站　　　　Tags:eBPF 　点击:(29)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游