您当前的位置:首页 > 电脑百科 > 数据库 > MYSQL

MySQL实现汉字转拼音,赶快一起学起来

时间:2022-09-06 11:22:34  来源:今日头条  作者:198兜兜里有糖

今天接到一个新的业务需求,客户需要将指定的中文汉字转换成拼音(含:简拼、首全拼、尾全拼)。

1. 创建基础数据表

-- ----------------------------

-- Table structure for bst_wbjq

-- ----------------------------

DROP TABLE IF EXISTS `bst_wbjq`;

CREATE TABLE `bst_wbjq` (

`CHARACTOR` varchar(200) NOT NULL,

`word` varchar(100) NOT NULL,

`CODE` varchar(100) DEFAULT NULL,

`STROKE` varchar(200) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

 

-- ----------------------------

-- Table structure for tbl_pinyin

-- ----------------------------

DROP TABLE IF EXISTS `tbl_pinyin`;

CREATE TABLE `tbl_pinyin` (

`SN` bigint(20) NOT NULL,

`WORD` varchar(200) NOT NULL,

`PY` varchar(200) NOT NULL,

`PYLEVEL` int(11) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2. 插入基础数据记录

-- ----------------------------

-- Records of bst_wbjq

-- ----------------------------

truncate table bst_wbjq;

INSERT INTO `bst_wbjq` VALUES ('禅', 'C', 'P', '^K');

INSERT INTO `bst_wbjq` VALUES ('讶', 'Y', 'Y', '2T');

INSERT INTO `bst_wbjq` VALUES ('焉', 'Y', 'G', 'Pa');

INSERT INTO `bst_wbjq` VALUES ('阉', 'Y', 'U', 'V2');

INSERT INTO `bst_wbjq` VALUES ('烟', 'Y', 'O', 'Ng');

INSERT INTO `bst_wbjq` VALUES ('淹', 'Y', 'I', 'V^');

INSERT INTO `bst_wbjq` VALUES ('圊', 'Q', 'L', 'Rz');

INSERT INTO `bst_wbjq` VALUES ('圉', 'Y', 'L', 'S?');

INSERT INTO `bst_wbjq` VALUES ('帔', 'P', 'M', ';~');

.... ....

commit;

 

-- ----------------------------

-- Records of tbl_pinyin

-- ----------------------------

truncate table tbl_pinyin;

INSERT INTO `tbl_pinyin` VALUES ('33641', '胫', 'jing4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30749', '箅', 'bi4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30750', '箢', 'yuan1', '0');

INSERT INTO `tbl_pinyin` VALUES ('30751', '篁', 'huang2', '0');

INSERT INTO `tbl_pinyin` VALUES ('30752', '篦', 'bi4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30753', '篾', 'mie4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30754', '簋', 'gui3', '0');

INSERT INTO `tbl_pinyin` VALUES ('30755', '簪', 'zan1', '0');

INSERT INTO `tbl_pinyin` VALUES ('30756', '籀', 'zhou4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30757', '舄', 'xi4', '0');

INSERT INTO `tbl_pinyin` VALUES ('30758', '舢', 'shan1', '0');

INSERT INTO `tbl_pinyin` VALUES ('30759', '舨', 'ban3', '0');

.... ....

commit;

3. 创建汉字转拼音函数(存储过程、函数)

3.1. 创建存储过程:PRC_GET_PYM

-- ----------------------------

-- procedure structure for PRC_GET_PYM

-- ----------------------------

delimiter $$

drop procedure if exists PRC_GET_PYM;

$$

create procedure PRC_GET_PYM(IN V_NAME varchar(256),OUT V_PYM varchar(256))

begin

declare i int default 1;

declare j int default 0;

declare V_PINYIN_TEMP VARCHAR(70);

declare V_NAME_TEMP varchar(200);

declare V_NAME_SIN varchar(10);

declare V_PINYIN_SIN varchar(10);

declare v_counter1 int(8);

 

#替换各种特殊符号

select replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(V_NAME,

'A','A'),'B','B'),'C','C'),'D','D'),'E','E'),'F','F'),'G','G'),'H','H'),

'I','I'),'J','J'),'K','K'),'L','L'),'M','M'),'N','N'),'O','O'),'P','P'),

'Q','Q'),'R','R'),'S','S'),'T','T'),'U','U'),'V','V'),'W','W'),'X','X'),

'Y','Y'),'Z','Z'),'+',''),'-',''),'*',''),'/',''),

'[',''),']',''),'{',''),'}',''),'(',''),')',''),

'<',''),'>',''),'《',''),'》',''),'(',''),')',''),'"',''),

'“',''),'”',''),'.',''),'。',''),'-',''),'-',''),'/',''),

'/',''),'  ',''),' ',''),'1','一'),'2','二'),'3','三'),

'4','四'),'5','五'),'6','六'),'7','七'),'8','八'),'9','九'),'0','零') R3

into V_NAME_TEMP

from dual;

 

#循环获得字符串拼音码

myloop:loop

if V_NAME is null then

leave myloop;

end if;

 

select substr(V_NAME_TEMP, i, 1) into V_NAME_SIN from dual;

set i=i+1;

if V_NAME_SIN <> ' ' then

select count(*)

into v_counter1

from bst_wbjq

where bst_wbjq.charactor=v_name_sin;

if v_counter1 > 0 then

select WORD

into V_PINYIN_SIN

from bst_wbjq

where bst_wbjq.CHARACTOR=V_NAME_SIN

limit 1;

select concat_ws('',V_PINYIN_TEMP,V_PINYIN_SIN)

into V_PINYIN_TEMP

from dual;

end if;

end if;

select char_length(V_NAME) into j from dual;

if i > j then

leave myloop;

end if;

end loop;

#截取32位长度字符

if char_length(V_PINYIN_TEMP) > 32 then

select substr(V_PINYIN_TEMP, 1, 32) into V_PYM from dual;

else

select V_PINYIN_TEMP into V_PYM from dual;

end if;

end;

$$

delimiter ;

3.2. 创建存储过程:SP_PINYIN

-- ----------------------------

-- procedure structure for SP_PINYIN

-- ----------------------------

delimiter $$

drop procedure if exists SP_PINYIN;

$$

create procedure SP_PINYIN(IN hanzi varchar(256),OUT pinyin varchar(256))

begin

declare aword varchar(200);

declare aresult varchar(200);

declare temp1 varchar(20);

declare len int default 0;

declare point int default 1;

declare charword varchar(20);

declare charlen int default 1;

#定义游标标志变量

declare done int default false;

#定义游标

declare cur_pinyin cursor for

select PY from TBL_PINYIN

where word=substr(aword, point, charlen);

#指定游标循环结束时的返回值

declare continue HANDLER for not found set done=true;

select ltrim(rtrim(hanzi)) into aword from dual;

select char_length(aword) into len from dual;

#<<LABEL1>>

while point <= len do

select '' into temp1 from dual;

select substr(aword, point, 1) into charword from dual;

if (charword is not null and charword != ' ') then

select concat_ws(' ',aresult,charword) into aresult from dual;

else

select 2 into charlen from dual;

end if;

#打开游标

open cur_pinyin;

#开始循环处理游标里的数据

read_loop:loop

#获得游标当前指向的一条数据

fetch cur_pinyin into temp1;

#判断游标的循环是否结束

if done then

leave read_loop;

end if;

end loop; #结束游标循环

#关闭游标

close cur_pinyin;

if (point = 1) then

set aresult = temp1;

else

select concat_ws(' ',aresult,temp1) into aresult from dual;

end if;

select point+charlen into point from dual;

end while;

#输出结果

select aresult into pinyin from dual;

end;

$$

delimiter ;

3.3. 创建函数:to_pinyin

-- ----------------------------

-- function structure for to_pinyin

-- ----------------------------

delimiter $$

drop function if exists to_pinyin;

$$

create function to_pinyin(v_hanzi varchar(256),v_type int)

returns varchar(256)

begin

declare strTemp VARCHAR(200);

declare strResult VARCHAR(200);

declare strHanzi VARCHAR(200);

declare strTemp1 VARCHAR(200);

declare v_subb VARCHAR(100);

declare V_NAME_TEMP VARCHAR(200);

declare v_pinyin VARCHAR(200);

#替换各种特殊符号

select replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(replace(

replace(replace(replace(replace(replace(replace(replace(replace(v_hanzi,

'A','A'),'B','B'),'C','C'),'D','D'),'E','E'),'F','F'),'G','G'),'H','H'),

'I','I'),'J','J'),'K','K'),'L','L'),'M','M'),'N','N'),'O','O'),'P','P'),

'Q','Q'),'R','R'),'S','S'),'T','T'),'U','U'),'V','V'),'W','W'),'X','X'),

'Y','Y'),'Z','Z'),'+',''),'-',''),'*',''),'/',''),

'[',''),']',''),'{',''),'}',''),'(',''),')',''),

'<',''),'>',''),'《',''),'》',''),'(',''),')',''),'"',''),

'“',''),'”',''),'.',''),'。',''),'-',''),'-',''),'/',''),

'/',''),'  ',''),' ',''),'1','一'),'2','二'),'3','三'),

'4','四'),'5','五'),'6','六'),'7','七'),'8','八'),'9','九'),'0','零') R3

into V_NAME_TEMP

from dual;

if v_type = '1' then #简拼

set @V_NAME_TEMP=V_NAME_TEMP;

set @strResult=null;

call Prc_Get_Pym(@V_NAME_TEMP, @strResult);

elseif v_type = '2' then #尾全拼

#判断结尾字符是否是中文

select ltrim(rtrim(substr(V_NAME_TEMP, char_length(V_NAME_TEMP), char_length(V_NAME_TEMP))))

into v_subb

from dual;

if v_subb is null then #如果不是中文则直接生成开口码

set @V_NAME_TEMP=V_NAME_TEMP;

set @strResult=null;

call Prc_Get_Pym(@V_NAME_TEMP, @strResult);

else

select substr(V_NAME_TEMP, 1, char_length(V_NAME_TEMP)-1) into strHanzi from dual;

set @strHanzi=strHanzi;

set @strTemp1=null;

call Prc_Get_Pym(@strHanzi, @strTemp1);

select substr(V_NAME_TEMP, char_length(V_NAME_TEMP), char_length(V_NAME_TEMP)) into strHanzi from dual;

set @strHanzi=strHanzi;

set @strTemp=null;

call Sp_Pinyin(@strHanzi, @strTemp);

select substr(@strTemp, 1, char_length(@strTemp) - 1) into @strResult from dual;

select concat_ws('',@strTemp1,@strResult) into @strResult from dual;

end if;

elseif v_type = '3' then #首全拼

#判断开头字符是否是中文

select ltrim(rtrim(substr(V_NAME_TEMP, 1, 1))) into v_subb from dual;

if v_subb is null then #如果不是中文则直接生成开口码

set @V_NAME_TEMP=V_NAME_TEMP;

set @strResult=null;

call Prc_Get_Pym(@V_NAME_TEMP, @strResult);

else

select substr(V_NAME_TEMP, 2, char_length(V_NAME_TEMP)) into strHanzi from dual;

set @strHanzi=strHanzi;

set @strResult=null;

call Prc_Get_Pym(@strHanzi, @strResult);

select substr(V_NAME_TEMP, 1, 1) into strHanzi from dual;

set @strHanzi=strHanzi;

set @strTemp=null;

call Sp_Pinyin(@strHanzi, @strTemp);

select concat_ws('',substr(@strTemp, 1, char_length(@strTemp) - 1),@strResult) into @strResult from dual;

end if;

end if;

set v_pinyin=UPPER(@strResult);

return v_pinyin;

end;

$$

delimiter ;

4. 使用方法/案例

 



Tags:MySQL   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
MySQL 核心模块揭秘
server 层会创建一个 SAVEPOINT 对象,用于存放 savepoint 信息。binlog 会把 binlog offset 写入 server 层为它分配的一块 8 字节的内存里。 InnoDB 会维护自己的 savepoint...【详细内容】
2024-04-03  Search: MySQL  点击:(7)  评论:(0)  加入收藏
MySQL 核心模块揭秘,你看明白了吗?
为了提升分配 undo 段的效率,事务提交过程中,InnoDB 会缓存一些 undo 段。只要同时满足两个条件,insert undo 段或 update undo 段就能被缓存。1. 关于缓存 undo 段为了提升分...【详细内容】
2024-03-27  Search: MySQL  点击:(11)  评论:(0)  加入收藏
MySQL:BUG导致DDL语句无谓的索引重建
对于5.7.23之前的版本在评估类似DDL操作的时候需要谨慎,可能评估为瞬间操作,但是实际上线的时候跑了很久,这个就容易导致超过维护窗口,甚至更大的故障。一、问题模拟使用5.7.22...【详细内容】
2024-03-26  Search: MySQL  点击:(10)  评论:(0)  加入收藏
从 MySQL 到 ByteHouse,抖音精准推荐存储架构重构解读
ByteHouse是一款OLAP引擎,具备查询效率高的特点,在硬件需求上相对较低,且具有良好的水平扩展性,如果数据量进一步增长,可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】
2024-03-22  Search: MySQL  点击:(25)  评论:(0)  加入收藏
MySQL自增主键一定是连续的吗?
测试环境:MySQL版本:8.0数据库表:T (主键id,唯一索引c,普通字段d)如果你的业务设计依赖于自增主键的连续性,这个设计假设自增主键是连续的。但实际上,这样的假设是错的,因为自增主键不...【详细内容】
2024-03-10  Search: MySQL  点击:(9)  评论:(0)  加入收藏
准线上事故之MySQL优化器索引选错
1 背景最近组里来了许多新的小伙伴,大家在一起聊聊技术,有小兄弟提到了MySQL的优化器的内部策略,想起了之前在公司出现的一个线上问题,今天借着这个机会,在这里分享下过程和结论...【详细内容】
2024-03-07  Search: MySQL  点击:(28)  评论:(0)  加入收藏
MySQL数据恢复,你会吗?
今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要...【详细内容】
2024-02-22  Search: MySQL  点击:(49)  评论:(0)  加入收藏
如何在MySQL中实现数据的版本管理和回滚操作?
实现数据的版本管理和回滚操作在MySQL中可以通过以下几种方式实现,包括使用事务、备份恢复、日志和版本控制工具等。下面将详细介绍这些方法。1.使用事务:MySQL支持事务操作,可...【详细内容】
2024-02-20  Search: MySQL  点击:(53)  评论:(0)  加入收藏
为什么高性能场景选用Postgres SQL 而不是 MySQL
一、 数据库简介 TLDR;1.1 MySQL MySQL声称自己是最流行的开源数据库,它属于最流行的RDBMS (Relational Database Management System,关系数据库管理系统)应用软件之一。LAMP...【详细内容】
2024-02-19  Search: MySQL  点击:(38)  评论:(0)  加入收藏
MySQL数据库如何生成分组排序的序号
经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。...【详细内容】
2024-01-30  Search: MySQL  点击:(54)  评论:(0)  加入收藏
▌简易百科推荐
MySQL 核心模块揭秘
server 层会创建一个 SAVEPOINT 对象,用于存放 savepoint 信息。binlog 会把 binlog offset 写入 server 层为它分配的一块 8 字节的内存里。 InnoDB 会维护自己的 savepoint...【详细内容】
2024-04-03  爱可生开源社区    Tags:MySQL   点击:(7)  评论:(0)  加入收藏
MySQL 核心模块揭秘,你看明白了吗?
为了提升分配 undo 段的效率,事务提交过程中,InnoDB 会缓存一些 undo 段。只要同时满足两个条件,insert undo 段或 update undo 段就能被缓存。1. 关于缓存 undo 段为了提升分...【详细内容】
2024-03-27  爱可生开源社区  微信公众号  Tags:MySQL   点击:(11)  评论:(0)  加入收藏
MySQL:BUG导致DDL语句无谓的索引重建
对于5.7.23之前的版本在评估类似DDL操作的时候需要谨慎,可能评估为瞬间操作,但是实际上线的时候跑了很久,这个就容易导致超过维护窗口,甚至更大的故障。一、问题模拟使用5.7.22...【详细内容】
2024-03-26  MySQL学习  微信公众号  Tags:MySQL   点击:(10)  评论:(0)  加入收藏
从 MySQL 到 ByteHouse,抖音精准推荐存储架构重构解读
ByteHouse是一款OLAP引擎,具备查询效率高的特点,在硬件需求上相对较低,且具有良好的水平扩展性,如果数据量进一步增长,可以通过增加服务器数量来提升处理能力。本文将从兴趣圈层...【详细内容】
2024-03-22  字节跳动技术团队    Tags:ByteHouse   点击:(25)  评论:(0)  加入收藏
MySQL自增主键一定是连续的吗?
测试环境:MySQL版本:8.0数据库表:T (主键id,唯一索引c,普通字段d)如果你的业务设计依赖于自增主键的连续性,这个设计假设自增主键是连续的。但实际上,这样的假设是错的,因为自增主键不...【详细内容】
2024-03-10    dbaplus社群  Tags:MySQL   点击:(9)  评论:(0)  加入收藏
准线上事故之MySQL优化器索引选错
1 背景最近组里来了许多新的小伙伴,大家在一起聊聊技术,有小兄弟提到了MySQL的优化器的内部策略,想起了之前在公司出现的一个线上问题,今天借着这个机会,在这里分享下过程和结论...【详细内容】
2024-03-07  转转技术  微信公众号  Tags:MySQL   点击:(28)  评论:(0)  加入收藏
MySQL数据恢复,你会吗?
今天分享一下binlog2sql,它是一款比较常用的数据恢复工具,可以通过它从MySQL binlog解析出你要的SQL,并根据不同选项,可以得到原始SQL、回滚SQL、去除主键的INSERT SQL等。主要...【详细内容】
2024-02-22  数据库干货铺  微信公众号  Tags:MySQL   点击:(49)  评论:(0)  加入收藏
如何在MySQL中实现数据的版本管理和回滚操作?
实现数据的版本管理和回滚操作在MySQL中可以通过以下几种方式实现,包括使用事务、备份恢复、日志和版本控制工具等。下面将详细介绍这些方法。1.使用事务:MySQL支持事务操作,可...【详细内容】
2024-02-20  编程技术汇    Tags:MySQL   点击:(53)  评论:(0)  加入收藏
MySQL数据库如何生成分组排序的序号
经常进行数据分析的小伙伴经常会需要生成序号或进行数据分组排序并生成序号。在MySQL8.0中可以使用窗口函数来实现,可以参考历史文章有了这些函数,统计分析事半功倍进行了解。...【详细内容】
2024-01-30  数据库干货铺  微信公众号  Tags:MySQL   点击:(54)  评论:(0)  加入收藏
mysql索引失效的场景
MySQL中索引失效是指数据库查询时无法有效利用索引,这可能导致查询性能显著下降。以下是一些常见的MySQL索引失效的场景:1.使用非前导列进行查询: 假设有一个复合索引 (A, B)。...【详细内容】
2024-01-15  小王爱编程  今日头条  Tags:mysql索引   点击:(85)  评论:(0)  加入收藏
站内最新
站内热门
站内头条