基于Jsoup获取页面的header map,title和keywords - 泡杯茶,过来坐坐 - ITeye博客

`

小网客

浏览: 1216878 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

masuweng：嗯,写的很好
Mysql之Incorrect string value: '\xF0\x9F\x98\x89 \xE6...'
秋水涛静：来来来你告诉我你贴的这代码有什么用？？你给的下载包又有什么 ...
利用diyUpload做多图片上传及预览
andseny：如果可以的话，求一份源码，谢谢邮箱：846526948@q ...
利用diyUpload做多图片上传及预览
alloyer：不错！可以使用，已验证。
Spring与jcaptcha集成
bewithme：这和我去官网看有啥区别？
web之日期组件My97DatePicker

基于Jsoup获取页面的header map,title和keywords

博客分类：

Spider
Java

阅读更多

需求：

需要采集页面的title和keyword

实现：

依赖：

<dependency>
	<groupId>org.jsoup</groupId>
	<artifactId>jsoup</artifactId>
	<version>1.6.3</version>
</dependency>

代码：

Connection.Response response = connection.execute();
Map<String, String> headerMap= response.headers();
String body = response.body();
Document document = Jsoup.parse(body);
String title = document.head().select("title").text();
String keywords = document.head().select("meta[name=keywords]").attr("content");

分享到：

互联网爬虫IP列表 | eclipse注释模板中设置@author

2013-12-26 11:27
浏览 2553
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

jsoup爬虫获取某网站的信息: 使用jsoup技术连接网站地址，通过改变参数获取网站div...项目中包括dbutil链接数据库的工具类，执行sql的helper工具类，获取网站div图片保存到本地的工具类信息，包括了jsoup1.10.1的jar包和commom-dbutils1.5的jar包；

基于jsoup的java爬虫项目: 基于jsoup的java爬虫项目，maven项目除用户密码外其他资源都有可直接用也可去我博客看使用或者问我

jsoup获取网页正文: jsoup获取网页正文

使用jsoup获取网页内容并修改: 通过使用jsoup库，获取网页的内容，解析修改网页，并且能够显示出修改的结果。

Java爬虫Jsoup+httpclient获取动态生成的数据: 主要介绍了Java爬虫Jsoup+httpclient获取动态生成的数据的相关资料,需要的朋友可以参考下

Jsoup解析Html获取新闻列表: 使用jsoup解析hmtl，获取对应数据

基于jsoup的SpringBoot爬虫demo: 基于jsoup解析url地址爬取网页信息整合SpringBoot独立idea项目

基于jsoup实现爬虫和IKAnalyzer分词器: 基于jsoup实现爬虫和IKAnalyzer分词器，自己学习时编写的一个简单的例子，以智联招聘，和boss直聘为目标

java基于jsoup+mongodb的简单爬虫入门程序: java基于jsoup+mongodb的简单爬虫入门程序，简单易懂，希望能给大家提供帮助

java+jsoup抓取网页数据: 使用java+jsoup进行网页数据的抓取，提取自己想要的数据

Jsoup 抓取页面的数据实例详解: 主要介绍了Jsoup 抓取页面的数据实例详解的相关资料,需要的朋友可以参考下

Java基于jsoup实现的爬虫技术: Java基于jsoup实现的爬虫技术，通过Java EE项目管理，前端通过Echarts展示

基于Jsoup爬虫抓取图吧网地名: 基于Jsoup爬虫抓取图吧网地名，可以实现到3级地名的爬虫。热门地名，旅游地名。按照一级二级分类。保存到txt文本。软件使用jswing，界面可配置。有需要的来下载吧。搭配动态刷新路由器ip效果比较佳。防止ip被限制。

jsoup 网页信息抓取选择器: 此抓取是抓取新浪高尔夫频道的新闻，采用的是jsoup 选择器抓取，比起httpparse 更好，更高效的抓取。

android Jsoup获取网站内容（实例为新闻标题获取），android网络必学: 近期做简单的新闻客户端界面使用到了Jsoup获取，使用起来特别方便，这也是被我一个学长称为学android网络必学的一个东西，在此也是分享一下自己近期所学。

jsoup采集网上数据: jsoup采集网上数据，可以实现网络数据采集下来，到别的网站爬取数据

android Jsoup获取网站内容 android获取新闻标题实例: 近期做简单的新闻客户端界面使用到了Jsoup获取，使用起来特别方便，这也是被我一个学长称为学android网络必学的一个东西，在此也是分享一下自己近期所学。首先还是给出效果：上面是通过textview显示的一个从网站...

Global site tag (gtag.js) - Google Analytics