`
sbpya
  • 浏览: 602539 次
  • 性别: Icon_minigender_1
  • 来自: 杭州,长沙
社区版块
存档分类
最新评论

一个实用的例子:JSP抓取网页代码的程序

阅读更多

 

 

< %@ page contentType="text/html;charset=gb2312"%>
< % 

String sCurrentLine; 

String sTotalString; 

sCurrentLine=""; 

sTotalString=""; 

java.io.InputStream l_urlStream; 

java.net.URL l_url = new java.net.URL("http://www.163.net/"); 

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); 

l_connection.connect(); 

l_urlStream = l_connection.getInputStream(); 

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream)); 

while ((sCurrentLine = l_reader.readLine()) != null) 

sTotalString+=sCurrentLine; 

out.println(sTotalString); 

%>

后记 

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics