今天在开发一个关于QQ号登录的功能时,发现获取的QQ号昵称中有的带有一些特殊的字符。而这些带有特殊字符的昵称在其它功能中调用时会发生一些判断错误,所以就写了一个过滤的正规表达式,用来过滤昵称中的特殊字符,只保留中文,英文以及数字。
utf8编码表达式
/[\x{4e00}-\x{9fa5}a-zA-Z0-9]/u
非utf8编码表达式
/[\x80-\xFF]/
以面已经给出的过滤规则的正则表达式,我们可以利用正则表达式编写一个函数,用于过滤字符串中的特殊字符,只保留中文,英文以及数字三种类型的字符串。
函数如下:
<?php function match_chinese($chars,$encoding='utf8'){ $pattern =($encoding=='utf8')?'/[\x{4e00}-\x{9fa5}a-zA-Z0-9]/u':'/[\x80-\xFF]/'; preg_match_all($pattern,$chars,$result); return join('',$result[0]); } ?>
调用方法:
<?php $str = "feiniaomy.com?墨初。zblog,?#$%^&())*(&^"; echo match_chinese($str); ?>
输出结果:
feiniaomycom墨初zblog