正则表达式学习笔记

hgfghwq15

浏览: 49778 次
性别:
来自: 青岛

最近访客更多访客>>

zhouvsjian

gdtiti

和平共处

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

技术杂绘

　　元字符： \b: 匹配一个位置,可以是一个串中间的某个位置，单词的开始或着结尾"er\b",匹配her,不匹配hert; "\bea" 匹配eat, 不匹配heat, . : 匹配除去换行符以外的任意字符。 * : 匹配任意数量，指*前边的内容你个可以连续重复使用任意次(可以是0次)以使整个表达式得到匹配。例子： \bhi\b.*\blucy\b; : 意思是先是一个单词hi，然后是任意数量的任意非换行字符，最后事lucy单词相当于{0，} \d: 匹配一位数字(0-9); 例子： 0\d\d-\d\d\d\d\d\d\d\d : 匹配以0开头，然后是两个数字，然后是一个连字号"-",最后是8个数字。： 0\d{2}-\d{8}; {}内地数字表示\d 连续出现2/8 次 \s: 匹配任意的空白字符，包括空格，制表符，换行符，中文全角空格等， \w: 匹配字母，数字，下划线，或者汉字例子： \ba\w*\b：匹配以字母a开头的单词，先是字母a后是任意数量的字母或数字下划线汉字等 +：使匹配重复至少一次，相当于{1,} 例子：\d+: 匹配一个或多个连续的字符 {}：具体指定匹配多少次例子： {2}: 匹配两次； {5, 12}: 至少匹配5次，最多匹配12次 {4，}: 至少匹配4次， ^ : ^不在[]中括号内时，匹配字符串开始，整个字符串的开始位置，不可能是中间的某个位置 $ ：匹配字符串结束，整个字符串的结束位置，不可能是中间的位置 ? ：匹配0次或者1次。相当于{0,1} []：匹配中括号内的任意字符例子： [aeiou]: 匹配以一个英文元音字母， [.?!]: 匹配.或?或! $?0\d{2}[)-]?\d{8}: "("")"也是元字符。$? 匹配0个活1个(; 0:匹配0； \d{2}: 匹配两个数字 [)-]? : 匹配0/1个)/-； \d{8} 匹配8个数字；(010)88886666，或022-22334455，或02912345678 分支条件： | 例子：0\d{2}-\d{8}|0\d{3}-\d{7}：匹配两种以-分割的电话号码，010-12345678 或者 0376-1234567 注意分支条件的顺序：例子： \d{5}-\d{4}|\d{5}：匹配美国的邮政编码，使用-间隔的9位数字，或者5位数字。如果改为： \d{5}|\d{5}-\d{4}，则会只匹配5位邮政编码，或者9位号吗的前5位，因只有\d{5}起作用。分组：() 指定一段表达式为一组，这个组可以指定是否重复及重复次数 (\d{1,3}\.){3}\d{1,3}：一个简单的ip地址格式匹配 ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0 -5]|[01]?\d\d?) 反义: \S : 与\s相反 \W : 与\w相反 \D : 与\d相反 \B : 与\b相反 [^x]: 匹配除去x以外的任意字符 [^aeiou]：匹配除去aeiou这几个字符的任意字符向后引用：从左向右，以分组的做括号为标志，第一个出现的分组编号为1，第二个为2，以此类推。例子： \b(\w+)\b\s+\1\b : 匹配像 go go. ha ha ;等重复的字符串分类代码/语法说明捕获 (exp) 匹配exp,并捕获文本到自动命名的组里：\b(\w+)\b\s+\1\b (?exp) 匹配exp,并捕获文本到名称为name的组里，也可以写成 (?'name'exp) ： \b(?\w+)\b\s+\k\b (?:exp) 匹配exp,不捕获匹配的文本，也不给此分组分配组号零宽断言 (?=exp) 匹配exp前面的位置 (?正则表达式的处理产生任何影响，用于提供注释让人阅读注：零宽断言只匹配位置，接下来的四个用于查找在某些内容(但并不包括这些内容)之前或之后的东西，也就是说它们像\b,^,$那样用于指定一个位置，这个位置应该满足一定的条件(即断言)，因此它们也被称为零宽断言。最好还是拿例子来说明吧：断言用来声明一个应该为真的事实。正则表达式中只有当断言为真时才会继续进行匹配。 (?=exp)也叫零宽度正预测先行断言，它断言自身出现的位置的后面能匹配表达式exp。比如\b\w+(?=ing\b)，匹配以ing结尾的单词的前面部分(除了ing以外的部分)，如查找I'm singing while you're dancing.时，它会匹配sing和danc。 (?表达式exp。比如(?表达式就会出错。这是因为[^u]总要匹配一个字符，所以如果q是单词的最后一个字符的话，后面的[^u]将会匹配q后面的单词分隔符(可能是空格，或者是句号或其它的什么)，后面的\w*\b将会匹配下一个单词，于是\b\w*q[^u]\w*\b就能匹配整个Iraq fighting。负向零宽断言能解决这样的问题，因为它只匹配一个位置，并不消费任何字符。现在，我们可以这样来解决这个问题：\b\w*q(?!u)\w*\b。零宽度负预测先行断言(?!exp)，断言此位置的后面不能匹配表达式exp。例如：\d{3}(?!\d)匹配三位数字，而且这三位数字的后面不能是数字；\b((?!abc)\w)+\b匹配不包含连续字符串abc的单词。同理，我们可以用(?表达式exp：(?表达式(?).*(?=)，这个表达式最能表现零宽断言的真正用途。一个更复杂的例子：(?).*(?=)匹配不包含属性的简单HTML标签内里的内容。()指定了这样的前缀：被尖括号括起来的单词(比如可能是)，然后是.*(任意的字符串),最后是一个后缀(?=)。注意后缀里的\/，它用到了前面提过的字符转义；\1则是一个反向引用，引用的正是捕获的第一组，前面的(\w+)匹配的内容，这样如果前缀实际上是的话，后缀就是了。整个表达式匹配的是和之间的内容(再次提醒，不包括前缀和后缀本身)。 192.168.0.2 \a 报警字符(打印它的效果是电脑嘀一声) \b 通常是单词分界位置，但如果在字符类里使用代表退格 \t 制表符，Tab \r 回车 \v 竖向制表符 \f 换页符 \n 换行符 \e Escape \0nn ASCII代码中八进制代码为nn的字符 \xnn ASCII代码中十六进制代码为nn的字符 \unnnn Unicode代码中十六进制代码为nnnn的字符 \cN ASCII控制字符。比如\cC代表Ctrl+C \A 字符串开头(类似^，但不受处理多行选项的影响) \Z 字符串结尾或行尾(不受处理多行选项的影响) \z 字符串结尾(类似$，但不受处理多行选项的影响) \G 当前搜索的开头 \p{name} Unicode中命名为name的字符类，例如\p{IsGreek} (?>exp) 贪婪子表达式 (?-exp) 平衡组 (?im-nsx:exp) 在子表达式exp中改变处理选项 (?im-nsx) 为表达式后面的部分改变处理选项 (?(exp)yes|no) 把exp当作零宽正向先行断言，如果在这个位置能匹配，使用yes作为此组的表达式；否则使用no (?(exp)yes) 同上，只是使用空表达式作为no (?(name)yes|no) 如果命名为name的组捕获到了内容，使用yes作为表达式；否则使用 no (?(name)yes) 同上，只是使用空表达式作为no

分享到：

验证整数、小数、实数、有效位小数最简单Ja ... | AndroidVirtual Devices (AVD)创建、设置

2012-07-06 09:37
浏览 615
评论(0)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论