把JSON/CSV文件打造成MySQL数据库

时间：2021-01-06 10:54:48 来源：作者：

生活中，你我一定都看到过这种「xx元爆改出租屋」，「爆改小汽车」之类的文章，做为IT人，折腾的劲头一点也不差。

软件开发过程中，你是否有时候，会拿着业务提供的一个个CSV或者JSON的数据文件，写个解析程序，把它们存到数据库里，再在自己的程序里通过数据库读出来？

其实不用这么麻烦，还绕了一个大圈。

今天，我们一起来「爆改」JSON/CSV这类文件，把它们打造成 MySQL一样的关系型数据库，一套SQL查询走天下。:-)

第一步：代码里加入Maven依赖

   <dependency>
      <groupId>org.Apache.calcite</groupId>
      <artifactId>calcite-file</artifactId>
      <version>1.21.0</version>
    </dependency>

通过这一步，你大概就看出来，咱们今天的爆改，主要依赖 Calcite，这个Apache的顶级项目。

来张官网截图感受下：

简单介绍的话，它是个数据库查询和优化的引擎，不负责具体的存储。

所以介绍里人家自己也说了，是你高性能数据库的地基。许多的开源项目是基于它做的，比如大名鼎鼎的这些：

第二步：添加配置文件

配置的JSON 文件，一般是下面这样子：

改造的配置文件，就像行军打仗的地图一样，来告诉我们往哪走，这里的配置文件，对应到关系型数据库里，就像是哪个库，哪些表一样。

{
  "version": "1.0",
  "defaultSchema": "SALES",
  "schemas": [
    {
      "name": "SALES",
      "type": "custom",
      "factory": "org.apache.calcite.adapter.file.FileSchemaFactory",
      "operand": {
        "directory": "sales"
      }
    }
  ]
}

其中schemas 表示都有哪些数据库， defaultSchema 当然是默认数据库了。factory 表示当前的数据文件，我们使用哪种Schema的形式进行解析。因为 Calcite 可以支持多种数据格式，通过这个图你也能感受到几分吧。

第三步：JDBC Style

通过 JDBC 的形式就能连接到我们自己的数据库查询了。代码和一般的JDBC类似，区别只在于连接URL的写法上，需要将配置文件的位置声明一下。

public class Demo {
    public static void main(String[] args) throws SQLException, ClassNotFoundException {
        Class.forName("org.apache.calcite.jdbc.Driver");
        Properties config = new Properties();
        config.put("model", "./src/main/resources/model.json");
        String sql = "select * from hello";


        try (Connection con = DriverManager.getConnection("jdbc:calcite:", config)) {
            try (Statement stmt = con.createStatement()) {
                ResultSet rs = stmt.executeQuery(sql);
                while (rs.next()) {
                    System.out.println(rs.getString(2));
                }
            }
        }
    }
}

其中SQL 语句，可以支持条件过滤，join 等所有的标准SQL。

整体项目结构如下：

PS: 忘了提一句，对于CSV文件，第一行需要将各列列名和类型加上，表示数据库表里定义的列。

你说我很忙，不想啰哩啰嗦再写个JAVA程序，办法也还有。有个程序叫 sqlline，可以方便你在命令行里执行，一个脚本连接到对应的文件数据库之后，就开始你飞一般的SQL表演吧。

sqlline> !connect jdbc:calcite:model=src/main/resources/model.json admin admin

Have fun!

作者：Tomcat那些事儿

原文：https://my.oschina.net/u/4585957/blog/4875292

Tags：MySQL 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

MySQL 使用 Mysqldump 备份导入数据导致主从异常

作者：雷文霆爱可生华东交付服务部 DBA 成员，主要负责Mysql故障处理及相关技术支持。爱好看书，电影。座右铭，每一个不曾起舞的日子，都是对生命的辜负。本文来源：原创投稿 *爱可生...【详细内容】

2021-12-24　　Tags: MySQL 点击:(6)　　评论:(0)　　加入收藏

Docker如何构建mysql主从？

一、为什么要搭建主从架构呢1.数据安全，可以进行数据的备份。2.读写分离，大部分的业务系统来说都是读数据多，写数据少，当访问压力过大时，可以把读请求给到从服务器。从而缓解数据...【详细内容】

2021-12-15　　Tags: MySQL 点击:(10)　　评论:(0)　　加入收藏

分享MySQL记录锁、间隙锁、临键锁小案例演示，你学废了吗

生成间隙(gap)锁、临键(next-key)锁的前提条件是在 RR 隔离级别下。有关Mysql记录锁、间隙(gap)锁、临键锁(next-key)锁的一些理论知识之前有写过，详细内容可以看这篇文章...【详细内容】

2021-12-14　　Tags: MySQL 点击:(17)　　评论:(0)　　加入收藏

mysqlbinlog基本认识

binlog 基本认识 MySQL的二进制日志可以说是MySQL最重要的日志了，它记录了所有的DDL和DML(除了数据查询语句)语句，以事件形式记录，还包含语句所执行的消耗的时间，MySQL的二...【详细内容】

2021-12-14　　Tags: MySQL 点击:(13)　　评论:(0)　　加入收藏

百万级数据下的mysql深度解析

为查询优化你的查询大多数的MySQL服务器都开启了查询缓存。这是提高性最有效的方法之一，而且这是被MySQL的数据库引擎处理的。当有很多相同的查询被执行了多次的时候，这些查...【详细内容】

2021-12-09　　Tags: MySQL 点击:(15)　　评论:(0)　　加入收藏

Mysql数据库tinyint，int，bigint，char，varchar究竟用哪个？

测试的目的和原因，公司有很多程序员，每个程序员对数据库和表结构都有自己的理解。而且每个程序员的理解往往是以效率考虑。既然都是为了效率考虑，那么我就来测试一下究竟哪种使...【详细内容】

2021-12-08　　Tags: MySQL 点击:(14)　　评论:(0)　　加入收藏

Win下部署多个MySQL数据库实例

当你们考虑项目并发的时候，我在部署环境，当你们在纠结使用ArrayList还是LinkedArrayList的时候，我还是在部署环境。所以啊，技术不止境，我在部环境。今天这篇文章缕一下在同一台服...【详细内容】

2021-12-08　　Tags: MySQL 点击:(16)　　评论:(0)　　加入收藏

MySQL中常用的15个查询子句

对于数据分析来说，MySQL使用最多的是查询，比如对数据进行排序、分组、去重、汇总及字符串匹配等，如果查询的数据涉及多个表，还需要要对表进行连接，本文就来说说MySQL中常用的查询...【详细内容】

2021-12-06　　Tags: MySQL 点击:(19)　　评论:(0)　　加入收藏

15个MySQL常用基本SQL语句

在学习SQL语句之前，首先需要区分几个概念，我们常说的数据库是指数据库软件，例如MySQL、Oracle、SQL Server等，而本文提到的数据库是指数据库软件中的一个个用于存储数据的容器。...【详细内容】

2021-11-24　　Tags: MySQL 点击:(23)　　评论:(0)　　加入收藏

用 MySQL 实现分布式锁，你听过吗？

概述以前参加过一个库存系统，由于其业务复杂性，搞了很多个应用来支撑。这样的话一份库存数据就有可能同时有多个应用来修改库存数据。比如说，有定时任务域xx.cron，和SystemA域...【详细内容】

2021-11-05　　Tags: MySQL 点击:(31)　　评论:(0)　　加入收藏

▌简易百科推荐

MySQL 使用 Mysqldump 备份导入数据导致主从异常

2021-12-24　　爱可生　　　　Tags:MySQL 　点击:(6)　　评论:(0)　　加入收藏

分享MySQL记录锁、间隙锁、临键锁小案例演示，你学废了吗

2021-12-14　　python数据分析　　　　Tags:MySQL记录锁　点击:(17)　　评论:(0)　　加入收藏

mysqlbinlog基本认识

2021-12-14　　linux上的码农　　　　Tags:mysql 　点击:(13)　　评论:(0)　　加入收藏

百万级数据下的mysql深度解析

2021-12-09　　元宇宙iwemeta　　　　Tags:mysql 　点击:(15)　　评论:(0)　　加入收藏

Mysql数据库tinyint，int，bigint，char，varchar究竟用哪个？

2021-12-08　　吴彬的分享　　　　Tags:Mysql数据库　点击:(14)　　评论:(0)　　加入收藏

Win下部署多个MySQL数据库实例

2021-12-08　　秃头码哥　　　　Tags:MySQL数据库　点击:(16)　　评论:(0)　　加入收藏

MySQL中常用的15个查询子句

2021-12-06　　笨鸟学数据分析　　　　Tags:MySQL 　点击:(19)　　评论:(0)　　加入收藏

15个MySQL常用基本SQL语句

2021-11-24　　笨鸟学数据分析　　　　Tags:SQL语句　点击:(23)　　评论:(0)　　加入收藏

用 MySQL 实现分布式锁，你听过吗？

2021-11-05　　Java云海　　　　Tags:分布式锁　点击:(31)　　评论:(0)　　加入收藏

MySQL高级SQL语句

MySQL的进阶查询一、按关键字排序使用ORDERBY语句来实现排序排序可针对一个或多个字段ASC:升序，默认排序方式【升序是从小到大】DESC:降序【降序是从大到小】ORDER BY的...【详细内容】

2021-11-05　　Java热点　　　　Tags:SQL语句　点击:(27)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为