本月博客排行
年度博客排行
-
第1名
青否云后端云 -
第2名
zw7534313 -
第3名
大家都说我很棒 - liyihz2008
- wy_19921005
- gengyun12
- hbxflihua
- e_e
- luxurioust
- dbagirl
- zysnba
- robotmen
- Alsmile
- gaozzsoft
- jywhltj
- cpongo1
- leslie26
- qepwqnp
- 解宜然
- cuityang
- gashero
- sichunli_030
- fantaxy025025
- vipbooks
- wallimn
- gdpglc
- ssydxa219
- javashop
- ranbuijj
- jickcai
- hanbaohong
- johnsmith9th
- appalese
- gaojingsong
- weiyides
- 淡看人生
- java-007
- zhangyi0618
- AVI
- laiyangdeli
- liunancun
- xpenxpen
- zhangdaiscott
- 龙哥IT
- conkeyn
- nychen2000
- ouanui
- silverend
- lemonhandsome
- jveqi
最新文章列表
用htmlparser提取table信息
htmlparser1.6提取tr似乎有些问题,直接用css selector提取的tr冗余,tr里面还有tr。所以这里多做了些处理。请看代码。
public static Map<String,String> parseList(String url) {
Map<String,String> rlt=new LinkedHashMap<String, ...
CssSelectorNodeFilter用法
这里演示htmlparser1.6中CssSelectorNodeFilter的用法。这个版本的CssSelector不支持pseudoclasses,比如:parent是不能用的。
import org.htmlparser.Parser;
import org.htmlparser.filters.CssSelectorNodeFilter;
import org.htmlpa ...