f=open('wuqu.html','r')
content=f.read()
m=re.findall('<tr>[\w|\W]*?</tr>', content)
print len(m)
if m is None:return
for i in range(1,len(m)):
c=m[i]
d=re.findall('<a[\w|\W]*?</a>', c)
if d is None:continue
if not len(d) == 4:continue
name= re.search(">(.*?)<",d[0]).group(1) #name
classify= re.search(">(.*?)<",d[1]).group(1) #classify
url=re.search('"/(.*?)"',d[3]).group(1) #url
us=url.split("=")
type=us[len(us)-1]
print type
handle=get_curl()
rv,mid,type=curl_fetch(handle,url)
store(mid,name,url,classify,type)
handle.close()
分享到:
相关推荐
python之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdf
学习python正则表达式的应用,用python编写,其中包含部分pdf文章
python_正则表达式_应用案例_compile、findall、finditer等
在 Python 语言中,通过标准库中的 re 模块支持正则表达式。re 模块提供了一些根据正则表达式进行查找、替换、分隔字符串的函数。 re 模块常用的函数包括: * match(pattern, string, flags=0):根据 pattern 从 ...
2. 匹配字符串:使用模式对象的match或search函数将正则表达式应用于字符串。 3. 提取匹配结果:使用group函数或groups函数提取匹配结果。 Python中正则表达式的实现: 1. import re:导入re模块。 2. pattern = ...
代码给出了正则表达式应用的案例,帮助理解正则表达式的用法
20个Python 正则表达式应用与技巧
这时个人经验,用例子来分析正则表达式的应用,里面的例子都时我的实践经验,所以很具有代表性
文章目录Python爬虫(二十一)—— 正则表达式应用详解 ——1. 简介2. 语法 1. 简介 正则表达式:regular expression,也称regex,简称 RE 正则表达式是用来简洁表达一组字符串的表达式 通用的字符串表达框架 简洁...
下面列出Python正则表达式的几种匹配用法,具体内容如下所示: 此外,关于正则的一切http://deerchao.net/tutorials/regex/regex.htm 1.测试正则表达式是否匹配字符串的全部或部分 regex=ur #正则表达式 if re....
表达式应用场合... 294 动态作用域及正则匹配效应... 295 匹配修改的特殊变量... 299 qr/…/运算符与regex对象... 303 构建和使用regex对象... 303 探究regex对象... 305 用regex对象提高效率... 306 Match...
这个很基础,就是对正则表达式的最基本的应用,先进阶的就不用看这个了,初学者可以看一下
如果用户熟悉Linux下的sed、awk、grep或vi,那么对正则表达式这一概念肯定不会陌生。...千万不要以为正则表达式只是Perl、Python、Bash等脚本语言的专利,作为C语言程序员,用户同样可以在自己的程序中运用正则表达式。
django book 2.0 中文官方文档 汉化版 。 本书所讲的是Django:一个可以使Web开发工作愉快并且高效的Web开发框架。 使用Django,使你能够以 最小的代价构建和维护高质量的Web应用。
Python正则表达式re模块简明笔记(实用应用文)
Python正则表达式在使用中会经常应用到字符串替换的代码。有很多人都不知道如何解决这个问题,下面的代码就告诉你其实这个问题无比的简单,希望你有所收获。 1.替换所有匹配的子串用newstring替换subject中所有与...
(3)要求应用程序应为Windows界面。 (4)选作部分:为了提高C++源程序的可读性,C++程序在书写过程中加入了空行、空格、缩进、注释等。假设你想牺牲可读性,以节省磁盘空间,那么你可以存贮一个删除了所有不必要...
正则表达式应用非常广泛,例如:php,Python,java等,但在linux中最常用的正则表达式的命令就是grep(egrep),sed,awk等,换句话 说linux三剑客要想能工作的更高效,就一定离不开正则表达式的配合。 1、什么是正则...
第3 版在前面的章节中增加了PHP的相关内容,并专门为理解和应用PHP的正则表达式增加了一章全新的内容。另外,该版对Java的章节也进行了修订,做了可观的扩充,反映了Java1.5和Java1.6的新特性。