`
l_mai
  • 浏览: 63982 次
社区版块
存档分类
最新评论
  • waret: "&" "ctrl+z& ...
    2011-12-13
  • waret: 在软件设计的过程中中有一些基本的原则,其中有一条是少用继承,多 ...
    2011-11-14
  • waret: 1、序列化是干什么的?  简单说就是为了保存在内存中的各种对象 ...
    2011-11-15
  • waret: 吼吼~最小长度为5~
    2011-10-22

httpclient解析gzip网页

 
阅读更多
转自http://www.cnblogs.com/yesun/archive/2008/10/31/1323432.html
请求时加上:getHC.setRequestHeader("Accept-Encoding","gzip, deflate");
解析时

String acceptEncoding = "";
     if(getHC.getResponseHeader("Content-Encoding")!=null)
      acceptEncoding = getHC.getResponseHeader("Content-Encoding").getValue();
     StringBuffer sb =new StringBuffer();
     log.debug("acceptEncoding:"+acceptEncoding);
     if(acceptEncoding.toLowerCase().indexOf("gzip") > -1)
     {
      //建立gzip解压工作流
      InputStream is = getHC.getResponseBodyAsStream();
      GZIPInputStream gzin = new GZIPInputStream(is);
      InputStreamReader isr = new InputStreamReader(gzin, charset); // 设置读取流的编码格式,自定义编码
      java.io.BufferedReader br = new java.io.BufferedReader(isr);
      String tempbf;
      while((tempbf=br.readLine())!=null){
       sb.append(tempbf);
       sb.append("\r\n");
      }
      isr.close();
      gzin.close();
     }
     else
     {
      InputStreamReader isr = new InputStreamReader(getHC.getResponseBodyAsStream(), charset); // 设置读取流的编码格式,自定义编码
      java.io.BufferedReader br = new java.io.BufferedReader(isr);
      String tempbf;
      while((tempbf=br.readLine())!=null){
       sb.append(tempbf);
       sb.append("\r\n");
      }
      isr.close();
     }
     getHC.abort();
     getHC.releaseConnection();
     ((SimpleHttpConnectionManager)httpClient.getHttpConnectionManager()).shutdown();
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics