`
roddy
  • 浏览: 16883 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java Read Html

    博客分类:
  • Java
阅读更多
Need Jar:
jsoup-1.8.1.jar



public static void main(String[] args) {
		String content="";
		try {
			content = executeGet("qq.com","t.qq.com","pgv_pvi=2633264128; RK=AWkaEwm4WM; ptcz=b94a87c80a0a85ceec47cd63566d582d7110bb329e378f2ef066185e9b957333; pt2gguin=o0002442254; ts_refer=url.cn/sorry; wbilang_10000=zh_TW; mb_reg_quick=1; wb_regf=%3B0%3B%3Bapi.t.qq.com%3B0; pgv_info=ssid=s1646546122; ts_last=t.qq.com/snow13000521; pgv_pvid=6340134792; o_cookie=2442254; ts_uid=9369757478");
		} catch (IOException e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		org.jsoup.nodes.Document doc = (org.jsoup.nodes.Document) Jsoup.parse(content);
		
    	org.jsoup.nodes.Element element = doc.getElementById("mainWrapper");
    	org.jsoup.nodes.Document doc2 = (org.jsoup.nodes.Document) Jsoup.parse(element.getElementsByClass("avatar").toString());
    	Elements elements = doc2.select("a[href]");
    	String qqUrl = "";
    	for(org.jsoup.nodes.Element ele : elements){
    		qqUrl = ele.attr("href");
    	}
    	
    	//To get region
    	try {
			content = executeGet("qq.com","t.qq.com","pgv_pvi=2633264128; RK=AWkaEwm4WM; ptcz=b94a87c80a0a85ceec47cd63566d582d7110bb329e378f2ef066185e9b957333; pt2gguin=o0002442254; ts_refer=url.cn/sorry; wbilang_10000=zh_TW; mb_reg_quick=1; wb_regf=%3B0%3B%3Bapi.t.qq.com%3B0; pgv_info=ssid=s1646546122; ts_last=t.qq.com/snow13000521; pgv_pvid=6340134792; o_cookie=2442254; ts_uid=9369757478");
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		//System.out.println(content);
		if(content.length()>0){
			org.jsoup.nodes.Document docAuthor = (org.jsoup.nodes.Document) Jsoup.parse(content);
			Elements elementAuthors = docAuthor.getElementsByClass("ico_location");
			if(elementAuthors.size()>0){
				org.jsoup.nodes.Element elementAuthor = elementAuthors.get(0).nextElementSibling();
				System.err.println("==QQ Region==== "+elementAuthor.text());
			}
		}
	}
分享到:
评论

相关推荐

    ReadHtml.java

    读取Html文件,利用正则表达式提取html里面所有a标签的url和文本,

    java源码包---java 源码 大量 实例

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包4

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包3

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    JAVA上百实例源码以及开源项目

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    JAVA上百实例源码以及开源项目源代码

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包2

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    Java操作USB源代码

    E:. │ .classpath ... │ ReadWrite.c │ resource.h │ sources │ sys.dsp │ sys.dsw │ sys.ncb │ sys.opt │ sys.plg │ Wmi.c │ └─Debug E:\android_svn\215256673JavaUSBComplete>

    成百上千个Java 源码DEMO 4(1-4是独立压缩包)

    JAVA+JSP的聊天室 8个目标文件 简单 JavaScript万年历 显示出当前时间及年份,还可以选择年份及月份和日期 Java编写的HTML浏览器 一个目标文件 摘要:Java源码,网络相关,浏览器 Java编写的HTML浏览器源代码,一个很...

    Java.EE.7.Essentials

    Create, Read, Update, and Delete Entities Entity Listeners Stored Procedures Validating the Entities Transactions and Locking Caching Chapter 14 : Java Message Service Sending a Message...

    java核心面试技术点

    (2) 清空工作内存数据, 从主存复制对象成员变量到当前工作内存, 即同步数据 (read and load) (3) 执行代码,改变共享变量值 (use and assign) (4) 将工作内存数据刷回主存 (store and write) (5) 释放对象监视器...

    Java for Programmers

    * Read archived issues of the DEITEL BUZZ ONLINE The practicing programmer’s DEITEL guide to Java development and the Powerful Java Platform Written for programmers with a background in high-level ...

    chart java applet

    - Help_english.html: Parameters of the servlet and applet - charapp.java: sample java application - chartApplet.java: source code of the applet - RChartServlet.java: source code of the servlet - ...

    java核心面试

    (2) 清空工作内存数据, 从主存复制对象成员变量到当前工作内存, 即同步数据 (read and load) (3) 执行代码,改变共享变量值 (use and assign) (4) 将工作内存数据刷回主存 (store and write) (5) 释放对象监视器...

    IBM的产品 JAVA调用解释

    If for any reason our links to Sun Microsystems, Inc. Java Development Kit documentation do not ...Note: Read the “Code license and disclaimer information” on page 521 for important legal information.

    java-IllegalArgumentException:此NavController未知导航目标xxx-代码日志.html

    链接is unknown to this NavController

    成百上千个Java 源码DEMO 3(1-4是独立压缩包)

    JAVA+JSP的聊天室 8个目标文件 简单 JavaScript万年历 显示出当前时间及年份,还可以选择年份及月份和日期 Java编写的HTML浏览器 一个目标文件 摘要:Java源码,网络相关,浏览器 Java编写的HTML浏览器源代码,一个很...

    java读取doc、docx、slx、xlsx等word和excel文件

    java读取doc、docx、slx、xlsx等word和excel文件,方法都集合在Read类中,返回一个HTML路径,可以用在WEB开发上,功能强大

    编写简单的代理服务器(java源码)

    基本原理: 代理服务器打开一个端口接收...while ((n=gotoin.read(buf))>=0) { out.write(buf,0,n); } out.close(); s.close(); } catch (IOException e) { System.out.println("Exception:"+e); } } };

Global site tag (gtag.js) - Google Analytics