淘先锋技术网

首页 1 2 3 4 5 6 7
正则表达式简介


正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。


一、元字符


元字符:即为有特定含义的字符,常见的元字符如下


常用的元字符
代码 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思
$ 匹配字符串的结束
详解和示例:


(1). 匹配任何任意字符    例如 .   可以匹配 1,n,*,+,- ,等


(2)\d\w\s    匹配第一个字符为数字,第二个字符为字母或数字、或下划线或汉字,第三字符为空格的字符串 例如:11   ,2a  , 1_    


(3)^\d\d\d$ 匹配三个全部都为数字的字符串  例如: 123,456,789


         还可以用于验证输入的字符串是否符合qq(身份证号)的验证 :


         例如:^\d{8}$ 匹配8位数字的qq号,^\d{15}&匹配15位均为数字的身份证号


(4)\bOlive\b 匹配单词Olive 例如: I Love Oliver and Olive .这个时候返回的是Olive 而不是Oliver,因为\b....\b返回的匹配的单词


二、反义字符


反义字符:多用于查找除某个字符以外其他任意字符均可以的情况


常用的反义字符如下:


常用的反义字符
代码/语法 说明
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
详解和示例:


(1)\W    匹配除字母、数字、下划线、汉字以为的字符形如  +,-,*


(2)\S     匹配除空格以外的任意字符形如:1,* ,)


(3)[^abcde]匹配除abcde以为的其他字符 如  e,f,g,h


三、限定字符


限定字符多用于重复匹配次数


常用的限定字符如下


常用的限定符
代码/语法 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
详解和示例:


(1)\d*   匹配重复0次或多次数字   例如:可能为空 或 任意数字 (2,3。。。。)


(2)\d+ 匹配重复1次或多次数字    例如:可能为1个或多个数字 1,23,234,2345,........


(3)\d? 匹配重复次个或者一次数字  例如:可能为空或者任意的一个数字(1,2,。。。)


(4)\d{8}匹配重复8次数字     例如:123456768


(5)\d{4,}匹配重复至少4次数字 例如:1234,12345,124244,。。。。。


(6)^\d{8,11}$ 匹配重复8-11次数字 例如:12345678,123456789,1234567890,12345678901


四、转义字符


在实际的开发中,可能会遇到要比配元字符的情况,这个时候就需要进行字符转义,如元字符 .  *  \ 需要转换为\.   \*   \\


例如: 需要匹配qq邮箱 \d{8,}+qq+\.+com  在这里的. 就需要加斜杠


五、字符分枝


字符分枝多用于满足不同情况的选择,用“|”将不同的条件分割开来,比如有些固定电话区号有三位,有些有四位,这个时候可以采用字符分枝


例如:\d{3}-\d{8}|\d{4}-\d{8}  可以匹配两种不同长度区号的固定电话


下边的IP地址正则表达式也有用到字符分枝


六、字符分组


字符分组多用于将多个字符重复,主要通过使用小括号()来进行分组


形如:(\d\w){3} 重复匹配3次(\d\w)


常用于表示IP地址   形如: ((25[0-5]|2[0-4][0-9]|[0-1]\d\d)\.){3}(25[0-5]|2[0-4][0-9]|[0-1]\d\d)


解析:先把IP地址分为两部分一部分是123.123.123. 另一部分是123,又因Ip最大值为255,所以先使用分组,然后在组里边再进行选择,组里也有三部分,0-199,200-249,250-255,分别和上述的表达是对应,最后还要注意分组之后还要加上一个.,因为是元字符所以要转义故加上\. 然后再把这部分整体看做是一个组,重复三次,再加上仅有数字的一组也就是不带\.的那一组即可完成IP地址的校验


常用分组语法