最新文章列表

WARC里的HTTP响应

WARC是一种格式。Heritrix(http://crawler.archive.org/)用它原封不动地储存HTTP请求和HTTP响应的全文。包括请求/状态行、头、内容。 读WARC格式很简单。利用Heritrix中提供的工具即可。 package warc; import java.io.*; import org.apache.commons.io.IOUtils; i ...
cloverprince 评论(0) 有2540人浏览 2011-02-16 17:20

最近博客热门TAG

Java(141744) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54919) .net(54785) Web(54514) 工作(54118) Linux(50905) Oracle(49875) 应用服务器(43289) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37267) 数据结构(36424)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics