`
twtmnm1314
  • 浏览: 66775 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
文章分类
社区版块
存档分类
最新评论

正则方式提取页面中的图片地址

 
阅读更多
<title>CETM-中国门户技术网</title><Textarea style='width:100%;height:300' id='a'>
<!--我们以本论坛的表情贴图页进行实例转换-->
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; Charset=gb2312">
<META content=LD在线网页编辑器v2 name=GENERATOR>
<STYLE>
body{}
a{}
a.hover{}
</STYLE>
</HEAD>
<BODY>

<IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em1.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em2.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em3.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em4.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em5.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em6.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em7.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em8.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em9.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em10.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em11.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em12.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em13.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em14.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em15.gif" lshdic=""> <IMG style="FILTER: ; CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em16.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em17.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em18.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em19.gif" lshdic=""> <IMG style="CURSOR: hand" src="http://www.lshdic.com/bbs/image/biaoqing/em20.gif" lshdic=""> <A href="javascript:opener=null;close()">[关闭窗口]</A> </BODY></HTML>
</textarea><br>
<input type='button' value='查找搜索图片地址' onclick='find1()'><a href=http://www.80nian.net>CETM提供</a><br>
<Textarea style='width:100%;height:200' id='b'></textarea>
<script>
function find1(){ //原作:CETM,我的方法可能不是最优效的但能解决问题,VBS的楼主自己变通
str1=a.value;strs="" //定义加速变量
var rep1=new RegExp("<img( ||.*?)src=('|\"|)(.*?)('|\"|>| )","gim") //定义正则模式
str2=str1.match(rep1) //搜索,主要得到length
rep1.exec(str1) //刷新regexp.$3
for(i=0;i<str2.length;i++){ //循环
rep1.exec(str1) //刷新regexp.$3
strs+=(RegExp.$3+"\n") //给值,起加速作用
}
b.value=strs
}
</script>
分享到:
评论

相关推荐

    下载网页源码并用正则表达式提取图片vb

    下载网页源码并用正则表达式提取图片,提取网页图片

    初学python爬虫,记录一下学习过程,正则表达式提取图片网址

    正则表达式模块提取网页图片地址 面向过程式编程 ''' #导入第三方库 import re import requests #请求头 headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' \ 'AppleWebKit/537.36 (KHTML, ...

    正则获取图片地址 链接地址

    可以获取网页中所有的图片地址和链接地址的代码,好像一般用在获取网页中的资源地址时用的到

    C#通过正则表达式实现提取网页中的图片

    本文给大家分享的是使用C#通过正则表达式来实现提取网页中的图片的代码,十分的方便,有需要的小伙伴可以参考下。

    初学python爬虫,记录一下学习过程,正则表达式提取文本

    紧接上一次正则表达式提取图片,这次提取文本 获取的是图书的书名,没有获取详细的内容 ''' 正则表达式模块提取网页文本 面向过程式编程 ''' #导入第三方库 import re import requests #请求头 headers = {'User-...

    正则表达式提取网址、标题、图片等一例(.Net Asp Javascript/Js)的实现

    在一些抓取、过滤等情况下, 正则表达式 regular expression 的优势是很明显的。 例如,有如下的字符串: 代码如下:&lt;li&gt;&lt;a&gt;”article-date”&gt;[09/11]&lt;/span&gt;FCKEditor高亮代码插件测试&lt;/a&gt;&lt;/li&gt; 现在,需要提取 href...

    Python使用正则表达式抓取网页图片的方法示例

    主要介绍了Python使用正则表达式抓取网页图片的方法,结合具体实例形式分析了Python网页文件的读取及正则匹配相关操作技巧,需要的朋友可以参考下

    java正则表达式匹配网页所有网址和链接文字的示例

    主要介绍了java正则表达式匹配网页所有网址和链接文字java正则表达式匹配,需要的朋友可以参考下

    ASPNETStripHtmlCode

    C#使用正则表达式提取网页中的信息数据 包括 网页标题(title),文本(text),图片(image),链接(link),表格(table)

    抓图神器2016

    本程序仅支持源码中有图片地址的网页图片抓取。一些采用高级技术的网页,图片地址在源码中不可见,暂不支持这类网站的图片抓取。 2. 从指定网页中提取所有链接,保存到由用户命名的文件中,若不加后缀,自动以.html...

    抓图神器2016 with update 3

    4. 本程序仅支持源码中有图片地址的网页图片抓取。一些采用高级技术的网页,图片地址在源码中不可见,暂不支持这类网站的图片抓取。 Unfixed Bugs: 1. 下载中点取消,会卡一阵,这是由于正在终止下载线程,网速不好...

    图片爬取关于美女、风景、机车、艺术等类型等很多类型的图片.zip

    Python爬虫是一种自动化获取网页数据的技术,它可以模拟人类浏览网页的行为,从网页中提取所需的信息。在爬取图片方面,Python爬虫同样具有强大的功能。 首先,我们需要了解图片的URL地址。通常情况下,图片的URL...

    基于规则模型的通用网页正文提取组件

    导航条 广告 正文 正文标题 相关文章 版权信息 评论 如大家还有其他想到的类型,请告之 &lt;br&gt;无法处理导航页,提取正文时也不考虑图片类文章及文章中的配图。 &lt;br&gt;该组件内部算法主要应用了规则模型抽取,所有...

    PHP获取淘宝aaa商品信息

    我们可以使用正则表达式 `/[^&gt;]*id="J_ImgBooth"[^r]*rc="([^"]*)"[^&gt;]*&gt;/` 来提取商品图片的地址。其中,`J_ImgBooth` 是淘宝商品页面中商品图片的 id。 2. 商品名称 我们可以使用正则表达式 `/([^]*)&lt;\/title&gt;/`...

    URL 筛选小工具 提取网页中的链接地址

    个VBS是用来将一个本地网页中的URL筛选出来并保存在新的网页文件中。当然,只要改变里面的正则表达式,就可以作其他用途了。

    美图录爬虫实例(python源码)

    根据美图录网页的结构和布局,使用BeautifulSoup的方法提取图片的URL、标题、标签等信息。 可以使用正则表达式对提取到的URL进行处理,去除多余的字符或参数。 下载图片: 使用requests.get()方法根据提取到的图片...

    qt网站爬虫源代码压缩包

    一个用Qt写的爬虫,可以下载https网站源代码,并通过正则表达式提取需要的图片URL,最后将图片下载到本地文件夹中,文件为QT的源代码,可执行。

    C#WPF爬虫示例程序

    如何从网页源码中提取页面的编码 抓取动态网页 使用CEFSharp来抓取动态网页 使用WebBrowser(IE)来抓取动态网页 使用Puppeteer来抓取动态网页 使用Selenium来抓取动态网页 WebAPI调用 获取实时天气 调用中国天气网...

    抓图神器2016 with update 1

    1. 从指定网页以及符合所设定的正则表达式匹配规则的二级页面中,一键下载所有图片。 一张图下载完成后会执行检查,自动删除头像之类的小图。 图片以该图在网页源码中的名字命名,若指定目录中已存在同名文件,则...

    Jmeter性能测试高级项目实践课程资源.rar

    1、通过JMETER 实践爬虫技术,爬取第三方平台全网页地址、批量爬取国外网站壁纸10W+图片并保存到本地; 课程从基础讲起,全程以实战为基础,每个知识点通过实际项目演练讲解理论实践结合,更容易理解,就算是小白也...

Global site tag (gtag.js) - Google Analytics