`
alanland
  • 浏览: 634299 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

python字符串解析,利用string模块和正则表达式re模块

阅读更多

1.python字符串通常有单引号('...')、双引号("...")、三引号("""...""")或('''...''')包围,三引号包含的字符串可由多行组成,一般可表示大段的叙述性字符串。在使用时基本没有差别,但双引号和三引号("""...""")中可以包含单引号,三引号('''...''')可以包含双引号,而不需要转义。
 
2. 用(\)对特殊字符转义,如(\)、(')、(")。
 
3.常用字符串内置函数
  1)str.count()  //返回该字符串中某个子串出现的次数
  2)str.find()   //返回某个子串出现在该字符串的起始位置
  3)str.lower()  //将该字符串全部转化为小写
  4)str.upper()  //转为大写
  5)str.split()  //分割字符串,返回字串串列表,默认以空格分割
  6)len(str)     //返回字符串长度
 
  例如:
  >>> str = 'Hello, world'
  >>> str.count('o')
  >>> 2
  >>> str.find('lo')
  >>> 3
  >>> str.lower()
  >>> 'hello, world'
  >>> str.upper()
  >>> 'HELLO, WORLD'
  >>> str.split()
  >>> ['Hello,', 'world']
  >>> str.split(',')
  >>> ['Hello', ' world']
  >>> len(str)
  >>> 13
  >>> str
  >>> 'Hello, world'
 
  以上所有操作都不会改变字符串本身!
 
4.正则表达式,re模块
  import re
  常用函数:
  1)compile():   //将正则表达式字符串编译成正则re对象
  2)search()     //在目标字符串中匹配正则表达式
  3)match()      //从目标字符串第一个字符开始匹配正则表达
  search和match匹配成功返回MatchObject对象,失败返回None
 >>> p = re.compile('abc')
 >>> p.search('zabcy')
 <_sre.SRE_Match object at 0x2a95659030>
 不先编译成正则re对象也是可以的,上例也可以为:
 >>> re.search('abc','xabcy')
 <_sre.SRE_Match object at 0x2a95659098>
 
 compile还可加些标志位,例如:re.I(re.IGNORECASE)忽略大小写
 >>> p = re.compile('abc')
 >>> print p.search('xAbCy')
 None
 >>> p = re.compile('abc',re.I)
 >>> print p.search('xAbCy')
 <_sre.SRE_Match object at 0x2a9565a098>
 
 
 search和 match区别见下例:
 >>> p = re.compile('abc')
 >>> print p.search('xxxabcyyy')
 <_sre.SRE_Match object at 0x2a95659030>
 >>> print p.match('xxxabcyyy')
 None
 >>> print p.match('abcyyy')
 <_sre.SRE_Match object at 0x2a95659098>
 
 
  4)split()      //类似字符串内置函数split()
   区别在于:内置split()以确定字符串分割,而正则split函数以正则表达式分割字
 

例如:以空格(1个或者多个空格)分割:

 >>> p.split('a b   c  d')
 ['a', 'b', 'c', 'd']

而内置split分割的结果为:

 >>> 'a b   c  d'.split(' ')
 ['a', 'b', '', '', 'c', '', 'd']
 
  5)findall()     //返回目标字符串中匹配正则表达式中所有子串列表
 

 >>> p = re.compile('^([a-z]{2}):([1-9]{3}):(.+)$')
 >>> p.findall('as:123:a12')
 [('as', '123', 'a12')]

 上例中正则表达式的子串为3个用括弧括起的,分别为:'[a-z]{2}'、'[1-9]{3}'、'.+', 分别被 as、123、a12匹配,注意此返回的是匹配字符串元组的一维列表。
  以上比较常用的正则函数,更多用法请参照python手册。
 
5.字符串与数字相互转换,string模块
  import string
  string.atoi(str[,base])  //base为可选参数,表示将字符转换成的进制类型
  数字转换成字符串可简单了,直接用str()
 
6. 字符与ASCII转换
  char->ascii  ord()
  ascii->char  chr()

 
分享到:
评论

相关推荐

    python-数字正则表达式.docx

    在Python中,正则表达式模块re提供了一组函数,可以用来处理字符串中的正则表达式。 数字正则表达式是一种特殊的正则表达式,它可以用来匹配数字。在Python中,数字正则表达式可以用来匹配整数、浮点数、科学计数法...

    python正则表达式re模块详细介绍

    本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮。 正则表达式使用反斜杆(\)来转义特殊字符,使其...

    python的正则表达式re模块的常用方法

    1.re的简介 使用python的re模块,尽管不能满足所有复杂的匹配情况,但足够在绝大多数情况下能够有效地实现对复杂字符串的分析并提取出相关信息。python 会将正则表达式转化为字节码,利用 C 语言的匹配引擎进行深度...

    python正则表达式及使用正则表达式的例子

    依次拿出表达式和文本中的字符串进行比价 如果每个字符都能匹配,则匹配成功;一旦有匹配不成功的字符,则匹配失败 如果有量词和边界,则匹配过程稍微有些不同 正则表达式语法规则 语法 说明 表达式...

    Python正则表达式如何进行字符串替换实例

    Python正则表达式在使用中会经常应用到字符串替换的代码。有很多人都不知道如何解决这个问题,下面的代码就告诉你其实这个问题无比的简单,希望你有所收获。 1.替换所有匹配的子串用new...Python字符串拆分 reres

    Python正则表达式使用经典实例

    下面列出Python正则表达式的几种匹配用法,具体内容如下所示: 此外,关于正则的一切http://deerchao.net/tutorials/regex/regex.htm 1.测试正则表达式是否匹配字符串的全部或部分 regex=ur #正则表达式 if re....

    python实现的正则表达式功能入门教程【经典】

    本文讲述了python实现的正则表达式功能。分享给大家供大家参考,具体如下: 前文: 首先,什么叫正则表达式(Regular Expression)? 例如我们要判断字符串”adi_e32fv,Ls”里面是否含有子串”e32f”,又例如我们在...

    Python使用正则表达式分割字符串的实现方法

    pattern:表示模式字符串,由要匹配的正则表达式转换而来。 string:表示要匹配的字符串。 maxsplit:可选参数,表示最大的拆分次数。 flags:可选参数表示标志位,用于控制匹配方式,如是否区分子母大小写 示例代码...

    Python 正则表达式匹配字符串中的http链接方法

    利用Python正则表达式匹配字符串中的http链接。主要难点是用正则表示出http 链接的模式。 import re pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+') #...

    Python的re模块正则表达式操作

    这个模块提供了与 Perl 相似l的正则...上面的写法是不是觉得很麻烦,为了使正则表达式具有更好的可读性,Python特别设计了原始字符串(raw string),需要提醒你的是,在写文件路径的时候就不要使用raw string了,这里

    详解Python正则表达式re模块

    正则是处理字符串最常用的方法,我们编码中到处可见正则的身影。 正则大同小异,python 中的正则跟其他语言相比略有差异: 1、替换字符串时,替换的字符串可以是一个函数 2、split 函数可以指定分割次数,这会导致有...

    Python正则表达式介绍

    正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别...

    Python正则表达式之基础篇

    正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。 其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。 它拥有自己独特的语法以及一个独立的处理引擎,在提供了...

    Python 正则表达式 re.match/re.search/re.sub的使用解析

    From Python正则表达式 re.match(pattern, string, flags=0) 尝试从字符串起始位置匹配一个模式;如果不是起始位置匹配成功,则 re.match() 返回none. 匹配成功,re.match() 返回一个匹配的对象,否则返回None. ...

    strutil:简单的小助手功能,可互换使用字符串和正则表达式

    简单的辅助函数可以互换使用字符串和正则表达式(通常)。 要求 Python 3.4以上 模块内容 strutil.is_string(obj) 检查obj是否为字符串 strutil.is_regex(obj) 检查obj是否为正则表达式 strutil.replace(text, ...

    Python正则表达式和元字符详解

    正则表达式 正则表达式是一种强大的字符串操作工具。它是一种领域特定语言 (DSL),不管是 ...Python 的正则表达式可以使用 re 模块访问,re 模块是标准库的一部分。 当你定义一个正则表达式,可以使用 re.match 函数

    二、正则表达式操作

    在实现时,可以用re模块提供的方法进行字符串处理,也可以先使用re模块compile()方法将模式字符串转换为正则表达式对象,然后再用该正则表达式对象的相关方法来操作字符串。 匹配字符串 使用match()方法进行匹配 ...

    零基础写python爬虫之神器正则表达式

    正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。 其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。 它拥有自己独特的语法以及一个独立的处理引擎,在提供了...

    正则表达式(regular)知识(整理)

    正则(regular),要使用正则表达式需要导入Python中的re(regular正则的缩写)模块。正则表达式是对字符串的处理,我们知道,字符串中有时候包含很多我们想要提取的信息,掌握这些处理字符串的方法,能够方便很多...

    Python正则表达式常用函数总结

    本文实例总结了Python正则表达式常用函数。分享给大家供大家参考,具体如下: re.match() 函数原型: match(pattern, string, flags=0)  Try to apply the pattern at the start of the string,  returning a ...

Global site tag (gtag.js) - Google Analytics