Java通过jsoup实现网页天气数据解析

pthill

浏览: 390238 次
性别:
来自: 长春

最近访客更多访客>>

凌语星

lindow

u012363178

anonyjack

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

JAVA

Java XML .net HTML

import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.MalformedURLException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;


public class WeatherTest {

	/**Java通过jsoup实现网页天气数据解析
	 * @param args
	 * @throws Exception 
	 * @throws UnsupportedEncodingException 
	 * @throws MalformedURLException 
	 */
	public static void main(String[] args) throws MalformedURLException, UnsupportedEncodingException, Exception {
		Document doc = getURLContent("http://www.soso.com/tb.q?cid=webq.wea");
		String content = doc.html();
		int beginLocal = content.indexOf("<xml id=\"WeatherData\" style=\"display:none\"> ");
		int endLocal = content.indexOf("</xml>");
		content = content.substring(beginLocal, endLocal);
		
		String cityStr = getXMLVarByName("<city>","</city>",content);
		System.out.println("城市："+cityStr);
		
		String dateStr = getXMLVarByName("<date>","</date>",content);
		System.out.println("日期："+dateStr);
		
		String todayTemperature = getXMLVarByName("<temperature>","</temperature>",content);
		System.out.println("今日气温："+todayTemperature);
		
		String todayWeather = getXMLVarByName("<weather>","</weather>",content);
		System.out.println("今日天气："+todayWeather);
		
		String todayWind = getXMLVarByName("<wind>","</wind>",content);
		System.out.println("今日风向："+todayWind);
	}
	/**
	 * 获取xml格式的信息
	 * @param name
	 * @param content
	 * @return
	 */
	private static String getXMLVarByName(String startStr, String endStr,String content){
		String xmlData = content;		
		int begin = xmlData.indexOf(startStr);		
		int end = xmlData.indexOf(endStr);		
		String result=xmlData.substring(begin+startStr.length(),end);
		result = result.trim();		
		return result;
	}
/**
 * 获取网页
 * @param docUrl
 * @return
 * @throws MalformedURLException
 * @throws IOException
 * @throws UnsupportedEncodingException
 */
	private static Document getURLContent(String docUrl) throws MalformedURLException, IOException, UnsupportedEncodingException {
		Document doc = Jsoup.connect(docUrl)
		  .data("query", "Java")
		  .userAgent("Mozilla")
		  .cookie("auth", "token")
		  .timeout(3000)
		  .post();
		return doc;
	}
}

需要jsoup的jar包，在附件上。

jsoup-1.5.2.jar (146.5 KB)
下载次数: 24

分享到：

使用 jsoup 对 HTML 文档进行解析和操作 | 【经验分享】十招让你设计不恶心的PPT

2011-04-03 10:04
浏览 1425
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java通过jsoup实现网页天气数据解析

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java通过jsoup实现网页天气数据解析

评论

发表评论

相关推荐

如何让cxf客户端简单支持ssl

webservice cxf 开发实战

JMeter 使用入门

Java知识拾遗：三大框架的技术起源

分享高效java开发者必备的资源列表

Office等类型文件的在线编辑

学习：二维码、QR码、J4L-QRCode、java

使用 jsoup 对 HTML 文档进行解析和操作

免费的office开发控件weboffice

Java程序把Word文档直接转换成HTML文件

Tomcat总死可以试一试调一下catalina.bat的这一行

Tomcat内存溢出的原因以及解决办法

PHP+MYSQL的OA为何没有Java的值钱

MyEclipse 6.0.1配置Tomcat 6服务器【图解】

一个Java Web搜索程序

java 查询可用域名

使用RSA算法进行加密和解密

用javascript与java进行RSA加密与解密

公钥加密私钥解密&私钥加密公钥解密

Java生成RSA非对称型加密的公钥和私钥(利用java API)

最近访客更多访客>>