前言:
网上有很多的抓取网页的代码,大部分是用的都是java api ,HttpClient,HttpURLConnection,io等等
新手看了是不是很晕呀?难道java抓个网页就这么费劲吗?
今天咱们利用apache commons io + 输出流重定向 的方式6行解决网页抓取问题(当然其实可以是5行 呵呵)
准备:
下载apache commons-io 传送门 然后将这个jar加入到你的项目中
//天气预报网址 String url="http://www.weather.com.cn/weather/101030100.shtml"; //是用apache commons io 直接把页面抓成String String htmlContent=IOUtils.toString(new URL(url)); //重定向输出流 到文件 PrintStream ps=new PrintStream(new File("D:/cxyapi.html")); System.setOut(ps); System.out.println(htmlContent); //这里的打印不在控制台,而是直接进入文件 ps.close();
声明:
1.原创文章,转载请标明并加本文连接。
2.文章反映个人愚见,如有异议欢迎讨论指正
3.更多的内容请看我的 个人博客(测试版)
相关推荐
20行python代码抓取网页中所有图片.py
获取网页密码-VC6代码,获取网页密码-VC6代码.
Python抓取网页代码 抓取了国家环境网站上的一组AQI数据
获取网页的纯文本信息内容,测试通过,也可修改抓取源码
jsp网页抓取天气预报源代码jsp网页抓取天气预报源代码jsp网页抓取天气预报源代码jsp网页抓取天气预报源代码
指定你要抓取网页的url。就可以抓取的网页的代码了。
网页代码获取工具
PB代码获取网页源代码weeeeeeeeeeeeeeeeeeeeeeeeeee
抓取网页源代码,vs2012c++编写,使用socket,只支持utf-8格式网页
http协议+socket获取网页内容源代码。
个人编写的java抓取网页内容的代码,可以下载斟酌
可以获取网页源代码,用来修改其源代码,然后你可以重新打开网页.
VC++ 获取网页源代码
VC++ 获取网页源代码
JSP抓取网页代码JSP抓取网页代码JSP抓取网页代码JSP抓取网页代码
抓取网页数据和内容,PreparedStatement的用法
利用IDHTTP多次获取网页代码,大概可以一次查询2万个网页代码,只要大家网速好,更多也没什么。
C#抓取网页股票年报数据程序源代码 程序使用httprequest,httpresponse实现网页的提交数据与页面抓取,并整理存储到Access数据库中。
一个自动获取网址html代码的网页 只要简单的输入网址就可以用获取了