- 浏览: 78391 次
- 性别:
- 来自: 青岛
最新评论
-
duanyong:
有用,但是没有看明白留着。
URI、URL、URN -
xgene:
要是字符做了旋转,还连接在一起,你怎么分?
java 图片像素级操作
",Pattern.DOTALL);
Pattern pa = Pattern.compile("
)+?", " ");// 转化换行 temp = temp.replaceAll("
(.*?)
",
Pattern.DOTALL);
Matcher ma = pa.matcher(html);
while (ma.find()) ...{
sb.append(ma.group());
}
String temp = sb.toString();
temp = temp.replaceAll("()+?", " ");// 转化换行 temp = temp.replaceAll("
.*?
", "");// 去图片注释 hm.put("title", title); hm.put("original", outTag(temp)); return hm; } /** *//** * * @param args * 测试一组网页,针对雅虎知识堂 */ public static void main(String args[]) ...{ String url=""; List list = new ArrayList(); System.out.print("输入URL,一行一个,输入结束后输入 go 程序开始运行: "); /**//* http://ks.cn.yahoo.com/question/1307121201133.html http://ks.cn.yahoo.com/question/1307121101907.html http://ks.cn.yahoo.com/question/1307121101907_2.html http://ks.cn.yahoo.com/question/1307121101907_3.html http://ks.cn.yahoo.com/question/1307121101907_4.html http://ks.cn.yahoo.com/question/1307121101907_5.html http://ks.cn.yahoo.com/question/1307121101907_6.html http://ks.cn.yahoo.com/question/1307121101907_7.html http://ks.cn.yahoo.com/question/1307121101907_8.html */ BufferedReader br = new BufferedReader(new InputStreamReader(System.in)); try ...{ while(!(url=br.readLine()).equals("go"))...{ list.add(url); } } catch (Exception e) ...{ e.getMessage(); } WebContent wc = new WebContent(); HashMap hm = new HashMap(); for (int i = 0; i < list.size(); i++) ...{ hm = wc.getFromYahoo(list.get(i)); System.out.println("标题: " + hm.get("title")); System.out.println("内容: " + hm.get("original")); } /**//* String htmlurl[] = { "http://ks.cn.yahoo.com/question/1307121201133.html", "http://ks.cn.yahoo.com/question/1307121101907.html", "http://ks.cn.yahoo.com/question/1307121101907_2.html", "http://ks.cn.yahoo.com/question/1307121101907_3.html", "http://ks.cn.yahoo.com/question/1307121101907_4.html", "http://ks.cn.yahoo.com/question/1307121101907_5.html", "http://ks.cn.yahoo.com/question/1307121101907_6.html", "http://ks.cn.yahoo.com/question/1307121101907_7.html", "http://ks.cn.yahoo.com/question/1307121101907_8.html" }; WebContent wc = new WebContent(); HashMap hm = new HashMap(); for (int i = 0; i < htmlurl.length; i++) { hm = wc.getFromYahoo(htmlurl[i]); System.out.println("标题: " + hm.get("title")); System.out.println("内容: " + hm.get("original")); } */ /**//* * String html=""; String link=""; String sscript=""; String content=""; * System.out.println(htmlurl+" 开始读取网页内容:"); * html=wc.getOneHtml(htmlurl); System.out.println(htmlurl+" * 读取完毕开始分析……"); html=html.replaceAll("()"," * ");//去除脚本 html=html.replaceAll("()"," * ");//去掉CSS html=html.replaceAll(".*?"," ");//除去页面标题 * html=html.replaceAll("]*href=("([^"]*)"|'([^']*)'|([^\s>]*))[^>]*>(.*?)"," * ");//去掉链接 html=html.replaceAll("(\s){2,}?"," ");//除去多余空格 * html=wc.outTag(html);//多余标记 System.out.println(html); */ /**//* * String s[]=html.split(" +"); for(int i=0;is[i].length())?content:s[i]; } * System.out.println(content); */ // System.out.println(htmlurl+"网页内容结束"); /**//* * System.out.println(htmlurl+"网页脚本开始:"); List * script=wc.getScript(html); for(int i=0;i); System.out.println(wc.outTag(html));
相关推荐
这是一个简单的C#编程示例,是我在微软网站上看了一些教程后,第一次用C#语言编码训练的结果,选择了使用使用HttpWebRequest和HttpWebResponse类进行网页获取和正则表达式进行网页分析作为课题。 该训练主要使用...
微网页分享到微信朋友圈插件代码
网页分析,网页分析利器,网页分析利器,网页分析利器
网页分享插件,可以实现微信、QQ、微博分享,内附有实例demo,简单易懂
jsoup网页分析jar包,里面包含两个版本,请随意使用。
VB编写网页分析工具源代码 分析指定网页的元素
网页分析源代码,在这里可以免费下载VB源代码
程序结合易语言网页操作类.ec模块和超文本浏览框,实现网页元素分析。
轻松实现把网页分享到QQ空间,人人网,百度,开心网等知名网站
java完整网页分享后端代码,功能已全部实现,直接放进去就可以使用,只需要把公众号的APPID和app_secret更换成自己的就可以使用,返回的数据直接就是对象,前端接收后可以直接使用
网页分析工具Sitemap
C# 网页分析抓取
WebPage Spy有一个HTML代码分析器,它能够在网页在浏览器显示一个网页的时候自动从其中 分析出该网页所含的HTML文件、Flash文件、JavaScript代码、Style Sheet代码、图像文件、 Applet文件、链接等等。所有这些...
delphi10.3开发的简易网页分析与整站下载程序,包含源代码。可自行扩充。目前针对htm页面的整站下载,可自行扩充至php,asp,jsp等页面。是网站分析的好帮手!
微信小程序web-view源码(含内嵌网页分享功能)亲自测试ok,将app.js下域名换成自己的域名即可
.net微网页分享到微信朋友圈插件代码
C#微网页分享到微信朋友圈插件代码
易语言网页分析小助手源码,网页分析小助手,初始化网页文档,取网页源码,取网页文本,取网页属性,取单个元素信息,取所有元素引用代码,取元素标识表
清晰彻底的网页分析工具 可以达到你想要完成的功能
网页分享插件,有qq空间、微博等等