`

Java 修复HTML标签

    博客分类:
  • Java
阅读更多

开源的组件:http://sourceforge.net/projects/jtidy/

网站:http://jtidy.sourceforge.net/

 

可以自动修复HTML文本中的标签问题。

 

代码如下:

 

 

import java.io.StringReader;

 

import org.w3c.tidy.Tidy;

 

public class JtidyTest {

 

public static void main(String[] args) {

Tidy tidy = new Tidy(); // obtain a new Tidy instance

tidy.setXHTML(true); // set desired config options using tidy setters 

tidy.setInputEncoding("utf8");

tidy.setShowWarnings(false);

        tidy.setWraplen(1024);

        tidy.setSmartIndent(true);

        tidy.setQuiet(true);

        tidy.setPrintBodyOnly(true);

        tidy.setOutputEncoding("utf8");

StringReader  sr = new StringReader("<div>这是文本<div>");

tidy.parse(sr, System.out); // run tidy, providing an input and output stream

sr = new StringReader("<div><p>这是文本</div>");

tidy.parse(sr, System.out); 

}

}

 

输出内容如下:

 

 

<div>这是文本</div>

<div>

  <p>这是文本</p>

</div>


看到了吧,自动修复了没有闭合的标签
分享到:
评论

相关推荐

    开源 免费 java CMS FreeCMS 1.5

    Bug修复: 同步资源文件时,复制后的文件有特殊字符问题。 linux下文件操作问题。 功能新增: info表增加isHot字段(是否热点). 增加留言本功能。 增加标签guestbook,guestbookList,guestbookPage. 会员增加我的...

    Java代码检查工具PMD

    PMD是一款采用BSD协议发布的Java程序代码检查工具... 1、修复了已有规则的一些bug  2、修改了 CPD 算法  3、JSP/JSF 解析器支持 Unicode  4、可处理 标签;  5、AST HtmlScript 节点包含内容,支持 Ecmascript 等等

    开源 免费 java CMS freecms-src-1.5

    Bug修复: 同步资源文件时,复制后的文件有特殊字符问题。 linux下文件操作问题。 功能新增: info表增加isHot字段(是否热点). 增加留言本功能。 增加标签guestbook,guestbookList,guestbookPage. 会员增加我的...

    pmdJava程序代码检查工具

    PMD是一款采用BSD协议发布的Java程序代码检查... 1、修复了已有规则的一些bug  2、修改了 CPD 算法  3、JSP/JSF 解析器支持 Unicode  4、可处理 标签;  5、AST HtmlScript 节点包含内容,支持 Ecmascript 等等

    Java程序代码检查工具PMD

    PMD是一款采用BSD协议发布的Java程序代码检查... 1、修复了已有规则的一些bug  2、修改了 CPD 算法  3、JSP/JSF 解析器支持 Unicode  4、可处理 标签;  5、AST HtmlScript 节点包含内容,支持 Ecmascript 等等

    开源 免费 java CMS FreeCMS用户手册1.5

    Bug修复: 同步资源文件时,复制后的文件有特殊字符问题。 linux下文件操作问题。 功能新增: info表增加isHot字段(是否热点). 增加留言本功能。 增加标签guestbook,guestbookList,guestbookPage. 会员增加我的...

    DaisyDiff:Java 中 HTML 的视觉比较

    --type=[html/tag] - 使用 html(默认)差异算法或标签差异。 --css=[cssfile1;cssfile2;cssfile3] - 添加外部 CSS 文件。 --output = [html / xml]-编写html(默认)或xml输出。 --q - 生成更少的

    Jspxcms网站内容管理系统 安装包 v9.0.0 tomcat版.zip

    5、修复:开启页面静态化后,某些栏目生成了HTML,但还会显示HTML待更新。 6、修复:文档管理doc上传按钮位置不正确。 7、修复:有上下文路径时,站点静态首页地址多了一个上下文路径。 8、修复:谷歌某些版本的...

    nicolas-carbonnier.github.io:Nicolas Carbonnier的作品集,IDMC Nancy认知科学硕士课程的一年级学生,以及Java,HTML,CSS,JavaScript和PHP开发人员

    Nicolas Carbonnier | 文件夹Nicolas Carbonnier的作品集,IDMC Nancy认知科学硕士课程的一年级学生,以及Java,HTML,CSS,JavaScript和PHP开发人员变更日志: v1.4.2:简历更新,作品集修改,背景幕过滤器添加和...

    JTopCms站群内容管理系统 v3.0.rar

    JTopcms基于J2EE核心模式自主研发,立项之初即考虑二次开发支持,扩展新模块只需具备Java web开发基础以及SQL能力,就可快速上手,高效无侵入方式开发功能。 11.支持资源发布点 支持自动将图片 视频 文件 以及静态...

    JspRun!社区论坛系统 v6.0 bulid 090423 GBK 源码版.rar

    20、修复了jspruncode的html解析错乱,如table表格,img图片标签 21、修复了版主超版部分后台权限 22、修复了主题付费、附件付费无效的问题 23、修复了积分交易功能无效的问题 24、修复了Wap设置时的页面错误、...

    JspRun!社区论坛系统 v6.0 bulid 090424 GBK 安装版.rar

    20、修复了jspruncode的html解析错乱,如table表格,img图片标签 21、修复了版主超版部分后台权限 22、修复了主题付费、附件付费无效的问题 23、修复了积分交易功能无效的问题 24、修复了Wap设置时的页面错误、...

    Jspxcms网站内容管理系统 源码包 v9.0.0.zip

    5、修复:开启页面静态化后,某些栏目生成了HTML,但还会显示HTML待更新。 6、修复:文档管理doc上传按钮位置不正确。 7、修复:有上下文路径时,站点静态首页地址多了一个上下文路径。 8、修复:谷歌某些版本的...

    spring-boot-autoconfigure-2.0.6.RELEASE-API文档-中英对照版.zip

    赠送jar包:spring-boot-autoconfigure-2.0.6....标签:spring、autoconfigure、springframework、boot、jar包、java、API文档、中英对照版; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵

    quartz-2.3.2-API文档-中文版.zip

    标签:quartz、scheduler、中文文档、jar包、java; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心...

    ehcache-3.9.9-API文档-中英对照版.zip

    标签:ehcache、jar包、java、中英对照文档; 使用方法:解压翻译后的API文档,用浏览器打开“index.html”文件,即可纵览文档内容。 人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心使用。 ...

    xhEditor(可视化HTML编辑器) v1.2.1官方最新版.rar

    v1.2.1 Change (2013-2-25)添加:增加以下三个初始化参数,用以分别定义段落标签、颜色列表、字体大小:listBlocktag、listColors、listFontsize添加:添加grunt构建支持,为开放式的代码贡献打下基础添加:语言包...

    JspRun!社区论坛系统 v6.0.0 build 20110516 GBK 安装版.zip

    32、修复了:搜索标签时,未过滤搜索关键字的问题 33、修复了:统计功能中,“积分排行”的缓存不起作用的问题。 34、修复了:后台查看禁止用户记录时,页面样式的错误。 35、修复了:论坛控制面版的公众用户组...

    JspRun!社区论坛系统 v6.0.0 build 20110516 UTF-8 源码版.zip

    32、修复了:搜索标签时,未过滤搜索关键字的问题 33、修复了:统计功能中,“积分排行”的缓存不起作用的问题。 34、修复了:后台查看禁止用户记录时,页面样式的错误。 35、修复了:论坛控制面版的公众用户组...

    JspRun!社区论坛系统 v6.0.0 build 20110516 GBK 源码版.zip

    32、修复了:搜索标签时,未过滤搜索关键字的问题 33、修复了:统计功能中,“积分排行”的缓存不起作用的问题。 34、修复了:后台查看禁止用户记录时,页面样式的错误。 35、修复了:论坛控制面版的公众用户组...

Global site tag (gtag.js) - Google Analytics