`
tcspecial
  • 浏览: 896347 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

正则表达式

阅读更多

 

 一. 基础

^$只指示位置,不占用空间

\b只指示位置,匹配单词边界;包括:中文/空格/换行

 

元字符:

\xNNN16进制,\x08f

\uNNNN16进制unicode字符,中文范围[\u4e00-\u9fa5]

 

分组:

/(ha){1,2}/ha分组当作一个字符单元,匹配hahawen

 

// js比较怪异,/xx/表示RegExp对象
/(ha){1,2}/.exec( 'hahawen' )

 

分支:

/^\s*|\s*$/g 去首尾空格

/(b|c)at/ /[bc]at/两者作用一致,后者效率高,没有尝试匹配过程

 

零宽断言:

这个概念比较复杂;零宽:只匹配一个位置;正向:满足pattern;负向:不满足pattern;先行:自左至右查找,判断右边pattern;断言:判断是否满足;

 

(?=pattern)     零宽正向先行断言,向后查找,后面是pattern的分组

(?!pattern) 零宽负向先行断言,向后查找,获取后面非pattern的分组

 

var str = '<div>line</div><br>'
/<(?=br>)/.exec( str )
// 输出:15  匹配br前的<
/<(?!br>)/.exec( str )
// 输出:0   匹配div前的<

 

(?<=pattern)零宽正向后行断言,向前查找,前面是pattern的分组

(?<!pattern)零宽负向后行断言,向前查找,前面非pattern的分组

/(?<=br)>/.exec( str )
// 输出:18  匹配<br后的>
/(?<!br)>/.exec( str )
// 输出:4   匹配<div后的>

 

替换除<br外所有的>

str.replace( /(<br)?>/g, function($0,$1){return $1?'':'&gt;'} )
// 输出:<div&gt;line</div&gt;  $0匹配整个内容(如:<br>),$1分组捕获内容(如:<br)

 

非占位组:

?:不占用分组位置,搜索时会略过。注:java/js中提取分组占位符为$1,而QT中为\1。

str = "Bob loves games";
str = str.replaceAll( "(Bob (?:loves) (games))",  "$1 | $2" );
// 输出:Bob loves games | games	games编号$2,略过loves

 

美元金额分割,将$10000000格式化为:$1,234,567,890?

String reg = "(?<=\\d)(?=(\\d{3})+\\b)";
String input = "$1234567890";
input.replaceAll( reg, "," )

 (?<=\\d) 前面为一个数字,正则引擎从$前开始搜索,发现$非数字,后移至1处(pos=2)

(?=(\\d{3})+\\b)        后面有3n个数字,以\b分界

 

可以打印搜索位置,发现pos=2,5,8处,\b限定分界处(不占用位置),直接插入空格,实在妙。

Pattern p = Pattern.compile(REGEX);
Matcher m = p.matcher(INPUT); 
int count = 0;

while( m.find() ) {
	System.out.println("count: " +++count + "\tstart: "+m.start() + "\tend:" + m.end());
}

 

 

QT正则操作:

1. 修改文本

// 括号分组,提炼相关组内容
QRegExp exp("(.*)=(.*)");
QString s="a=100";
s.replace(exp,"\\1*\\2=\\2");
qDebug()<<s;  // a*100=100

 

2. 匹配QT路径

// \比较特殊,正则表达式为转义符,此处需要加4个\才能匹配
QString str="d:\\Qt\\4.4.3\\lib\\QtSvgd4.lib";
QRegExp rga("[Qq]t\\\\(.*)\\\\lib");
qDebug("pos: %d",str.indexOf(rga));  // pos=3
// 提取组内容
QString version=str.cap(1);  // 4.4.3

 

3. 循环查找所有匹配内容 

QRegExp exp("E'([0-9a-f]{1,})'"); // 匹配16进制内容
QString str="values(1,'hello',E'003f','ming',E'893f')";
int pos=0;

// 循环查找
QStringList bList;
while((pos=exp.indexIn(str,pos))!=-1)
{
	bList.append(exp.cap(0)); // E'003f',0匹配整个内容

	QString value=exp.cap(1);
	qDebug("=== %s",qPrintable(value)); // 003f,匹配子内容
	pos+=exp.matchedLength();
}

 

4.. 匹配中文

QString str="hello 中国人 chinese";
QRegExp rg("[\u4e00-\u9fa5]"); // 中文匹配正则表达式,在VC6下无法正常工作,VS版本测试正常
str.contains(rg); // true

 

 

 

 

分享到:
评论

相关推荐

    常用java正则表达式

    如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一...

    正则表达式验证工具,正则表达式校验工具

    正则表达式验证工具 V1.0 本软件主要用于检测正则表达式是否正确。 运行环境:本软件为绿色软件,无需安装,但需要Microsoft .NET Framework 4 支持,如果没有请前去下载(下载路径:...

    学习正则表达式-Michael+Fitzgerald.pdf

    《学习正则表达式》从正则表达式的基本概念讲起,到编写完整的sed和Perl脚本,再到转换HTML文件,将这种强大的工具解释得清晰透彻。...《学习正则表达式》适合对正则表达式感兴趣的程序员和互联网从业者。

    《学习正则表达式》高清扫描版 PDF

    正物色一本学习正则表达式的入门图书?恭喜,《学习正则表达式》非常适合你!本书提供大量经典简洁的示例,从零开始教你逐步掌握正则表达式。通过匹配特定单词、字符和模式,读者很快就可以自己动手使用正则表达式...

    正则表达式验证正则表达式验证

    正则表达式正则表达式正则表达式正则表达式 验证程序

    正则表达式经典实例

    《正则表达式经典实例》讲解了基于8种常用的编程语言使用正则表达式的经典实例。书中提供了上百种可以在实战中使用的实例,以帮助读者使用正则表达式来处理数据和文本。对于如何使用正则表达式来解决性能不佳、误报...

    wps表格excel正则工具,excel正则表达式替换/匹配/查找/搜索/提取数字

    让 Office Excel、WPS 表格支持正则表达式的免费插件:「Excel 正则工具」顾名思义,需要使用 “正则表达式(PCRE)” 的知识来进行操作,对于完全没有接触过正则的朋友也许有一定的入门门槛,但正则实在是太过强大...

    csharp正则表达式参考手册

    正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用...

    正则表达式整理汇总(参考学习)

    正则表达式整理汇总,含以下内容 [1]里面在包括一个正则表达式测试小程序 RegexTester.exe [2]正则表达式30分钟入门教程.pdf] [3]正则表达式规则.doc [4]正则表达式30分钟入门教程.mht 自己整理用的,现在...

    常用正则表达式 正则表达式

    常用正则表达式 正则表达式 常用正则表达式 正则表达式

    正则表达式大全 - 收集的最常用正则表达式

    常用正则表达式大全: 匹配中文字符的正则表达式 匹配空白行的正则表达式 匹配HTML标记的正则表达式 匹配Email地址的正则表达式 匹配网址URL的正则表达式 匹配国内电话号 匹配中国邮政编码 匹配身份证 匹配ip地址 ...

    java正则表达式.zip

    java,正则表达式,详解,java正则表达式,PDF

    ASP.NET 中的正则表达式

    Microsoft®.NET Framework 对正则表达式的支持是一流的,甚至在 Microsoft® ASP.NET 中也有依赖正则表达式语言的控件。本文介绍了深入学习正则表达式的基础知识和推荐内容。 本文主要面向对正则表达式知之甚少或...

    Java正则表达式 Java 正则表达式

    Java正则表达式Java正则表达式Java正则表达式Java正则表达式

    正则表达式(日期校验)

    正则表达式日期校验 正则表达式日期校验 正则表达式日期校验

    C语言正则表达式库

    C语言正则表达式库,兼容perl的正则表达式库,使用简介、方便

    正则表达式教程和配套测试工具regextester

    非常棒的正则表达式速成教程,号称30分钟叫你学会正则表达式常用用法。我本人学了一下,感觉不赖,不过俺比较笨,30分钟的东西学了3个多小时,已经从什么都不会变成会编各种复杂的正则筛选条件了^^!这个教程是配合...

    UE正则表达式、UE正则表达式

    UE正则表达式、UE正则表达式

    日期正则表达式(很实用)

    日期正则表达式(很实用) 日期正则表达式(很实用)日期正则表达式(很实用)日期正则表达式(很实用)

    正则表达式汇总-Labview

    正则表达式汇总

Global site tag (gtag.js) - Google Analytics