凡是涉及到字符串匹配,以特定的一种规则分割字符串,替换字符串等问题,最好的解决方案,就是使用正则表达式,使用正则表达式是最方便的解决方案。
什么是 RegExp?RegExp 是正则表达式的缩写。
当您检索某个文本时,可以使用一种模式来描述要检索的内容。RegExp 就是这种模式。
简单的模式可以是一个单独的字符。
更复杂的模式包括了更多的字符,并可用于解析、格式检查、替换等等。
您可以规定字符串中的检索位置,以及要检索的字符类型,等等。
反斜杠的用处,就是可以转义字符 \n 换行
\t tab
\r 行结束
字符类[abc]a、b 或 c(简单类)[^abc]任何字符,除了 a、b 或 c(否定)[a-zA-Z]a 到 z 或 A 到 Z,两头的字母包括在内(范围)[a-d[m-p]]a 到 d 或 m 到 p:[a-dm-p](并集)[a-z&&[def]]d、e 或 f(交集)[a-z&&[^bc]]a 到 z,除了 b 和 c:[ad-z](减去)[a-z&&[^m-p]]a 到 z,而非 m 到 p:[a-lq-z](减去)中括号 [ ] 代表的是 一位,中括号里边可以放任意的内容。代表的是括号里边的平匹配括号里边的任意一位就可以。
比方说 [123456789] 代表的是只要是1到9的阿拉伯数字,就可以。例如 / [0-9] [a-z] [A-Z]/ 这样匹配的就是第一位是数字,第二位是小写字符第三位是大写字母的字符串。 比如 1aA
^ 尖角号 放在中括号[ ]里边代表的是 “非” 除了的意思
^ 尖角号 放在外边代表的是 以什么开始 /^ab/ 代表的是匹配以a开头的 ab串
$ 美元符 在表达式中代表的是结尾 /ab$/ 代表的是匹配以b结尾的 ab 字符串
开始符 和 结尾符一起使用,能够起到限制字符串的效果,例如 /^abc$/ 这样就只有在字符串是 abc 的时候,才能匹配出来
部分解析:
\b匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b
”可以匹配“never
”中的“er
”,但不能匹配“verb
”中的“er
”。\B匹配非单词边界。“er\B
”能匹配“verb
”中的“er
”,但不能匹配“never
”中的“er
”。
什么叫 单词边界, String str= "good nice" 字符串中单词nice的前边的空格就叫做单词边界
{n} 代表的是几个几个的匹配 例如{2} 每次匹配两个
{1,3} 匹配1到3个,匹配是贪婪算法。能够匹配就不少匹配
表达式全集 字符描述\将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“
n
”匹配字符“n
”。“\n
”匹配一个换行符。串行“\\
”匹配“\
”而“\(
”则匹配“(
”。^匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n
”或“\r
”之后的位置。$匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n
”或“\r
”之前的位置。*匹配前面的子表达式零次或多次。例如,zo*能匹配“z
”以及“zoo
”。*等价于{0,}。+匹配前面的子表达式一次或多次。例如,“zo+
”能匹配“zo
”以及“zoo
”,但不能匹配“z
”。+等价于{1,}。?匹配前面的子表达式零次或一次。例如,“do(es)?
”可以匹配“does
”或“does
”中的“do
”。?等价于{0,1}。{n}n是一个非负整数。匹配确定的n次。例如,“o{2}
”不能匹配“Bob
”中的“o
”,但是能匹配“food
”中的两个o。{n,}n是一个非负整数。至少匹配n次。例如,“o{2,}
”不能匹配“Bob
”中的“o
”,但能匹配“foooood
”中的所有o。“o{1,}
”等价于“o+
”。“o{0,}
”则等价于“o*
”。{n,m}m和n均为非负整数,其中n”能匹配“3.1Windows
”中的“Windows
”,但不能匹配“2000Windows
”中的“Windows
”。x|y匹配x或y。例如,“z|food
”能匹配“z
”或“food
”。“(z|f)ood
”则匹配“zood
”或“food
”。[xyz]字符集合。匹配所包含的任意一个字符。例如,“[abc]
”可以匹配“plain
”中的“a
”。[^xyz]负值字符集合。匹配未包含的任意字符。例如,“[^abc]
”可以匹配“plain
”中的“p
”。[a-z]字符范围。匹配指定范围内的任意字符。例如,“[a-z]
”可以匹配“a
”到“z
”范围内的任意小写字母字符。[^a-z]负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]
”可以匹配任何不在“a
”到“z
”范围内的任意字符。\b匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b
”可以匹配“never
”中的“er
”,但不能匹配“verb
”中的“er
”。\B匹配非单词边界。“er\B
”能匹配“verb
”中的“er
”,但不能匹配“never
”中的“er
”。\cx匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“c
”字符。\d匹配一个数字字符。等价于[0-9]。\D匹配一个非数字字符。等价于[^0-9]。\f匹配一个换页符。等价于\x0c和\cL。\n匹配一个换行符。等价于\x0a和\cJ。\r匹配一个回车符。等价于\x0d和\cM。\s匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。\S匹配任何非空白字符。等价于[^ \f\n\r\t\v]。\t匹配一个制表符。等价于\x09和\cI。\v匹配一个垂直制表符。等价于\x0b和\cK。\w匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]
”。\W匹配任何非单词字符。等价于“[^A-Za-z0-9_]
”。\xn匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“\x41
”匹配“A
”。“\x041
”则等价于“\x04&1
”。正则表达式中可以使用ASCII编码。.\num匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)\1
”匹配两个连续的相同字符。\n标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。\nm标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。\nml如果n为八进制数字(0-3),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。\un匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(©)。
常用正则表达式 用户名/^[a-z0-9_-]{3,16}$/密码/^[a-z0-9_-]{6,18}$/十六进制值/^#?([a-f0-9]{6}|[a-f0-9]{3})$/电子邮箱/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/ /^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/URL/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/IP 地址/((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)/ /^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$/HTML 标签/^)$/删除代码\\注释(?Unicode编码中的汉字范围
/^[\u2E80-\u9FFF]+$/
练习
写一个正则表达式,检验字符串首位是否含有数字 /^\d|\d$/ 代表的是首或者尾有数字
/^\d[\s\S]*\d$/ 这个代表的是首位都有数字
匹配形如 AAAA的字符串,/(\w)\1\1\1/
匹配形如AABB的字符串 /(\w)\1(\w)\2/