python抓取指定网址链接并返回网址列表 - - ITeye博客

`

a564941464

浏览: 177382 次
性别:
来自: 武汉

最近访客更多访客>>

xieyonn

hy1314200

时间的煮雨non

85756399

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

a564941464：一样
Initializers －－ object-c中的alloc init的解释
pj7670623：幸好有~~~有道！！不然咋看的懂哦！
Initializers －－ object-c中的alloc init的解释
higherzjm： [flash=200,200][/flash][url][/u ...
用jdb调试Java程序

python抓取指定网址链接并返回网址列表

博客分类：

python

urllib2 python re

阅读更多

import urllib2, re
def fetch_links(furl,burl,stag,etag):
    '''
    抓取网页新闻
    @param furl 抓取网页地址
    @param burl 网页链接的baseurl,比如凤凰网的链接:<a href="/news/guoji/dir?cid=14&amp;mid=7sdLRL">国际</a>, 根据baseurl可返回<a href="http://i.ifeng.com/news/guoji/dir?cid=14&amp;mid=7sdLRL">国际</a>
    @param stag 抓取网页链接的开始标签
    @param etag 抓取网页链接的结束标签
    @return 加了baseurl的链接列表
    说明: 正则表达式中 '.*?', 采用非贪婪模式匹配多个字符
    '''
    req = urllib2.Request(furl)
    fd = urllib2.urlopen(req)
    content = fd.read()
    fd.close()
    m = re.findall(stag+'.*?'+etag,content)
    return  [j.replace('<a href="', '<a href="'+burl) for j in m]

0
顶

0
踩

分享到：

django 1.3+ 静态资源的访问 | URL长度的限制

2012-03-28 17:39
浏览 3695
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

python 抓取百度云分享数据,百度云最新接口抓取分享链接: python 抓取百度云分享数据,百度云最新接口抓取分享链接。

Python 抓取网页下载链接: Python 抓取网页下载链接

Python实现抓取HTML网页并以PDF文件形式保存的方法: 主要介绍了Python实现抓取HTML网页并以PDF文件形式保存的方法,结合实例形式分析了PyPDF2模块的安装及Python抓取HTML页面并基于PyPDF2模块生成pdf文件的相关操作技巧,需要的朋友可以参考下

python抓取: python抓取

Python抓取京东数据: 使用Python抓取京东数据，并用mySQL存取数据

Python 抓取图片下载地址: Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片Python 抓取图片

Python 抓取图片（源码）: Python 抓取百度贴吧里边的图片内容

python抓取并保存html页面时乱码问题的解决方法: 主要介绍了python抓取并保存html页面时乱码问题的解决方法,结合实例形式分析了Python页面抓取过程中乱码出现的原因与相应的解决方法,需要的朋友可以参考下

python 抓取1688店铺产品详情爬虫: python 抓取1688店铺产品详情，爬虫

Python爬虫下载磁力链接: Python爬虫下载磁力链接

python 抓取一个网站所有图片并保存: python 抓取一个网站所有图片并保存。 python 抓取一个网站所有图片并保存 python 爬虫

基于python抓取豆瓣电影TOP250的数据及进行分析.pdf: 基于python抓取豆瓣电影TOP250的数据及进行分析.pdf

python抓取百度搜索的数据: python抓取百度搜索的数据,智普推荐使用教程

python抓取网页中链接的静态图片: 主要为大家详细介绍了python抓取网页中链接的静态图片，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

地图瓦片抓取之python: 地图瓦片抓取之python

python抓取天气并分析实例源码: Python代码抓取获取天气预报信息源码讲解。这是一个用Python编写抓取天气预报的代码示例，用python写天气查询软件程序很简单。这段代码可以获取当地的天气和、任意城市的天气预报...python抓取广州天气并分析实例源码

Python抓取页面、Pthon爬虫参考资料: 本文档包括在网上搜集的众多基于Python的网页抓取实例，包括代码及说明，不是原创，只是收集了一下里面有些例子确实很不错，看了几个例子我尝试编写了个QQ空间日志备份程序，效果还不错（详见资源： ...

Python抓取网页代码: Python抓取网页代码抓取了国家环境网站上的一组AQI数据

Global site tag (gtag.js) - Google Analytics