import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlToText{
public static void main(String[] args) {
// TODO Auto-generated method stub
String content=" <div style=\"LINE-HEIGHT: 30px\">指出:“信息化是公安机关的一场警务革命,对于这场革命,谁认识早,谁抓得好,谁就赢得主动,占领制高点”。省常委委、省委政法委书籍、省公安厅厅长孟苏铁通知多次强调:“加强信息化建设,是新形势下提升社会管理效能的必由之路,是实现公安工作跨越式发展的有力支撑”;“公安信息化是发展方向,更是前进动力;是工作载体,更是创新平台”;“要紧紧抓住公安信息化建设这个支撑点,在深化应用中全面增强公安机关的核心战斗力”。<p><p><span style=\"font-size:18px;\"> “工欲善其事,必先利其器。”在当前日益动态的社会治安形势下,我市公安机关要彻底扭转“打不胜打、防不胜防”的被动局面,实现警力不增、效能大增的目标,就必须积极主动适应信息化的发展趋势,加快信息化手段、战法的总结、提炼、推广和应用,坚持向信息化要警力、向科技手段要战斗力,通过信息化行成的强大后台,将广大侦查民警变成以一</span></p></div>";
String txtcontent = content.replaceAll("</?[^>]+>", ""); //剔出<html>的标签
txtcontent = txtcontent.replaceAll("\\s*|\t|\r|\n", "");//去除字符串中的空格,回车,换行符,制表符
System.out.println(txtcontent);
//指出:“信息化是公安机关的一场警务革命,对于这场革命,谁认识早,谁抓得好,谁就赢得主动,占领制高点”。省常委委、省委政法委书籍、省公安厅厅长孟苏铁通知多次强调:“加强信息化建设,是新形势下提升社会管理效能的必由之路,是实现公安工作跨越式发展的有力支撑”;“公安信息化是发展方向,更是前进动力;是工作载体,更是创新平台”;“要紧紧抓住公安信息化建设这个支撑点,在深化应用中全面增强公安机关的核心战斗力”。 “工欲善其事,必先利其器。”在当前日益动态的社会治安形势下,我市公安机关要彻底扭转“打不胜打、防不胜防”的被动局面,实现警力不增、效能大增的目标,就必须积极主动适应信息化的发展趋势,加快信息化手段、战法的总结、提炼、推广和应用,坚持向信息化要警力、向科技手段要战斗力,通过信息化行成的强大后台,将广大侦查民警变成以一
}
}
分享到:
相关推荐
对图片进行水印处理,利用TESS4J识别图片并提取信息生成excel表格。里面有字库文件所以占用空间较大。 说明:https://blog.csdn.net/xlantian/article/details/80789115
javacv对图片进行文字提取,定位指定文字在图片的位置坐标,提高识别速度
java实现用正则表达式的方法提取html中的信息,可以提取标题,正文,链接等。经过运行,没问题的
java图片提取文字信息java图片提取文字信息java图片提取文字信息
Java从视频中提取音频 下载依赖包是会比较慢,请在网络好的环境下载 依赖包下载好后,直接编译即可运行 懒得下载或网络不好的,可以去下方地址下载 https://download.csdn.net/download/qq_34096425/87804913
使用javacv实现的图像sift特征提取示例
Java项目公共模块提取,将Java的各个公共模块提取出来供以后使用,十分的通用的。
Java编写的提取一篇文章中的关键词的程序,使用TF-IDF算法提取文章中的关键词,使用Java原生sdk实现,可以运行。
JAVA 发送文本格和HTML格式并带图片链接的邮件实例,图片可以为附件可以为邮件正文显示,可以为图片添加超链接
主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作技巧,需要的朋友可以参考下
java 提取单个字符 java 提取单个字符
Java从压缩包中提取文件
今天小编就为大家分享一篇Java实现从Html文本中提取纯文本的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
java实现条形码二维码生成含文字标签信息
JAVA使用Jacob提取Word信息,一个很好的范例,帮助你简化书写流程
基于ImageJ的一个java图像处理插件 有完整的界面(尚未完善好) 暂时包含的是灰度特征的提取,包含像素个数,灰度直方图 正在完善形状和纹理特征,敬请期待!
使用java程序提取excel文件中指定固定单元格的内容,并将其输出至txt文件或xls文件,项目包含poi相应jar包,在eclipse2022.03,java1.8环境下测试通过
Java从压缩包中提取文件源码整理
通过调用百度AI的接口实现提取图片文字的java项目,可用于图片文字识别,身份证信息获取验证,证书内容获取