Python核心编程之正则表达式-练习题解答

hgfghwq27

浏览: 42938 次
性别:
来自: 西安

最近访客更多访客>>

sanren7915

kingtsing

fengkuang11

xfj

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

技术杂绘

　　1. 识别下列字符串："bat," "bit," "but," "hat," "hit," 或 "hut"   import re data=r'but,' patt='b.t,?' m=re.search(patt, data) if m is not None: print m.group() 2.匹配用一个空格分隔的任意一对单词，比如，名和姓     patt='\S+\s\S+' 3. 匹配用一个逗号和一个空格分开的一个单词和一个字母。例如，英文人名中的姓和名的首字母       patt='\S+,\s\S' 4. 匹配所有合法的Python标识符    patt='\W' 5.请根据您(读者)本地关于地址的格式写法匹配一个街道地址(你写出的正则表达式要尽可能通用以匹配任意数目的表示街道名字的单词，
　　包括类型指示)。比如，美国的街道地址使用这样的格式：1180 Bordeaux Drive.
　　使你写的正则表达式尽可能通用，要求能够匹配多个单词的街道名字，
　　如：3120 De la Cruz Boulevard.      patt='(\d+\s?)+(\S+\s?)+' 6.匹配简单的以"www."开头，以".com"作结尾的Web域名，例如：www.yahoo.com.
　　附加题：使你写的正则表达式还支持其他顶级域名：.edu, .net 等，比如：www.ucsc.edu.      patt='^www\.(\S+)\.?[com|edu|cn]
7.匹配全体Python整数的字符串表示形式的集合     patt='\d+' 8. 匹配全体Python长整数的字符串表示形式的集合    patt='\d+[L]?' 9. 匹配全体Python浮点数的字符串表示形式的集合 patt='\d+\.\d+' 10.匹配全体Python复数的字符串表示形式的集合     patt='[\d+|\d+\.\d+]+[\d+|\d+\.\d+]j' 11.匹配所有合法的电子邮件地址(先写出一个限制比较宽松的正则表达式，然后尽可能加强限制条件，但要保证功能的正确性)。 patt='\w+@(\w+\.)+com' 12.匹配所有合法的 Web 网站地址(URLs)(先写出一个限制比较宽松的正则表达式，然后尽可能加强限制条件，但要保证功能的正确性)。 patt='www\.(\w+\.)+(\w+)' 13.type(). type()内建函数返回一个对象类型，此对象显示为 Python 的字符串形式，
　　如下所示：
　　>>> type(0)
　　
　　>>> type(.34)
　　
　　>>> type(dir)
　　
　　请写一个正则表达式，能从这个字符串中提取出类型的名字。你的函数能实现以下功能：如
　　果以字符串""做输入，会返回类型"int".(返回其他类型也同理，如，返回类型'float',
　　'builtin_function_or_method'等) 提示：正确的结果保存在类和某些内建类型的__name__属性里。   import re data="" patt="" m=re.search(patt, data) if m is not None: print m.group(1) 14.正则表达式。在 15.2 小节里，我们给出一个匹配由一位或两位数字代表一月到九月的字符串形式("0?[1-9]")。请写出一个正则表达式    表示标准日历上其它的三个月(十月、十一月、十二月)。   patt="1[0-2]" 15.正则表达式。在15.2小节里，我们给出一个匹配信用卡卡号的模式：("[0-9]{15,16}").
　　但这个模式不允许用连字符号分割信用卡卡号中的数字。请写出一个允许使用连字符的正则表达式，
　　但要求连字符必须出现在正确的位置。例如，15位的信用卡卡号的格式是4-6-5,表示四个数字，一
　　个连字符，后面接六个数字、一个连字符，最后是五个数字。16位的信用卡卡号的格式是4-4-4-4，数位不足时，添0补位。 patt="([0-9]{4}-?[0-9]{6}-?[0-9]{5})|([0-9]{4}-?[0 -9]{4}-?[0-9]{4}-[0-9]{4})" 16.修改脚本 gendata.py 的代码，使数据直接写入文件 redata.txt 中，而不是输出到屏幕上。   ''' Created on 2010-12-11 @author: Administrator ''' from random import randint,choice from string import lowercase from sys import maxint from time import ctime doms=('com','edu','net','org','gov') dtstr='' for i in range(randint(5,10)): dtint=randint(0,maxint-1) dtstr+=ctime(dtint) shorter=randint(4,7) em='' for j in range(shorter): em+=choice(lowercase) longer=randint(shorter,12) dn='' for j in range(longer): dn+=choice(lowercase) t= '%s::%s@%s.%s::%d-%d-%d' %(dtstr,em,dn,choice(doms),dtint,shorter,longer) print t f=open('redata.txt','a') f.write(t) f.close()   18.通过检查每个输出行中整数字段部分的第一个整数是否和该行开头的时间戳相匹配来验证redata.txt中的数据是否完好 patt='(\d+)\d+{3}' 17.统计生成的redata.txt文件中，星期中的每一天出现的次数(或统计各月份出现的次数)。   import re patt='Jun' f=open('redata.txt','r') count=0 for eachLine in f.readlines(): m=re.findall('Jun', eachLine) count+=len(m) print len(m) #print data print 'the count of :%s is %d' %(patt,count)   18.通过检查每个输出行中整数字段部分的第一个整数是否和该行开头的时间戳相匹配来验证redata.txt中的数据是否完好 patt='(\d+)\d+{3}' 19. 提取出每行中完整的时间戳字段 patt='\s\d+{2}:\d+{2}:\d+{2}\s' 20.提取出每行中完整的电子邮件地址。 patt='\w+@\w+\.\w+' 21.只提取出时间戳字段中的月份。 patt=':(\d+):' 22.只提取出时间戳字段中的年份 patt='\s(\d+)
23.只提取出时间戳字段中的值(格式：HH:MM:SS)。 patt='\s\d+:\d+:\d+\s' 24.只从电子邮件地址中提取出登录名和域名(包括主域名和顶级域名,二者连在一起) patt='(\w+)@(\w+\.?\w+)' 25.只从电子邮件地址中提取出登录名和域名(包括主域名和顶级域名，二者分别提取)。 patt='(\w+)@(\w+\.?\w+)' 26. 将每行中的电子邮件地址替换为你自己的电子邮件地址 import re patt='(\w+@\w+\.?\w+)' f=open('redata.txt','r') for eachLine in f.readlines(): #print eachLine m=re.sub(patt, 'wangtao0422@gmail.com', eachLine) if m is not None: print m 27.提取出时间戳中的月、日、年，并按照格式"月日，年"显示出来，且每行仅遍历一次 import re patt='(\S+)\s(\d+)\s\d+:\d+:\d+\s(\d+)

f=open('redata.txt','r') for eachLine in f.readlines(): #print eachLine m=re.search(patt,eachLine) if m is not None: print m.groups() 28.区号(第一组的三个数字和它后面的连字符)是可选的，即，你写的正则表达式对 800-555-1212和555-1212都可以匹配 patt='(\d{3}-)?\d{3}-\d{4}' 29.区号中可以包含圆括号或是连字符，而且它们是可选的，就是说你写的正则表达式可以匹配800-555-1212, 或
　　555-1212, 或(800) 555-1212 patt='\(?\d{3}-?\)?\d{3}-\d{4}'

分享到：

禁止表单的自动完成(正则表达式的补充) | 自定义列表框,可以调整高度。

2012-07-06 09:37
浏览 1137
评论(0)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论