/** * * @param src 要过滤的语句 */ @Override public Set<String> checkSensitiveWords(String src) { if(AppUtils.isBlank(src)){ return null; } // 把数据库中的敏感字 塑造成list集合 List<String> sensitiveWordList = sensitiveWordDao.getWords(sortId, nsortId, subNsortId); Map<Character,List<String>> wordMap=new HashMap<Character,List<String>>(); for (String s:sensitiveWordList){ char c=s.charAt(0); List<String> strs=wordMap.get(c); if (strs==null){ strs=new ArrayList<String>(); wordMap.put(c,strs); } strs.add(s); } String temp=null; String find; char c; Set<String> findwords = new HashSet<String>(); for (int i=0;i<src.length();i++){ c=src.charAt(i); find=null; if (wordMap.containsKey(c)){ List<String> words=wordMap.get(c); for (String s:words){ temp=src.substring(i,(s.length()<=(src.length()-i))?i+s.length():i); if (s.equals(temp)){ find=s; break; } } } if (find!=null && findwords.size()<=10){ findwords.add(find); i+=(find.length()-1); } } return findwords; }
请尊重知识,请尊重原创 更多资料参考请见 http://www.cezuwang.com/listFilm?page=1&areaId=906&filmTypeId=1
相关推荐
该文件为.java文件,可以配合前面上传的敏感字收录文件进行使用的敏感字过滤工具;包括替换以及自定义过滤格式等
springBoot-java敏感词语过滤类
javaWeb实现的过滤器敏感字过滤,建一个敏感字符的文件,发送时实现过滤为***
Java 敏感词汇过滤 Java 敏感词汇过滤Java 敏感词汇过滤Java 敏感词汇过滤
论坛必不可少的敏感词过滤,java实现带敏感词库
在最近的开发中遇到了敏感词过滤,便去网上查阅了很多敏感词过滤的资料,在这里也和...下面这篇文章主要给大家介绍了关于java利用DFA算法实现敏感词过滤功能的相关资料,需要的朋友可以参考借鉴,下面来一起看看吧。
自己做的图片过滤小程序,打开图片动态过滤颜色,过滤后可保存。附源码、附说明。本人系java新手,不当之处请多指教。
工具使用 java 实现,帮助我们解决常见的问题。6W+ 词库,且不断优化更新 基于 DFA 算法,性能较好 基于 fluent-api 实现,使用优雅简洁 支持敏感词的判断、返回、脱敏等常见操作 支持全角半角互换 支持英文大...
Java敏感词过滤源码。内附三个文件,敏感词(仅测试),两个类文件(用于功能实现)
使用java 实现的可以对输入的String进行敏感词的过滤,返回敏感的词
高效敏感词过滤JAVA实现(DFA算法) 5000字2ms 节点 + 2进制标识(节省空间/提高查询效率) 附源码、注释,附带专业敏感词库(3396个敏感词) 看得上就拿去用,替换下一两处util方法、改个路径即可 不求什么,...
DFA全称为:Deterministic Finite Automaton,即确定有穷自动机。其特征为:有一个有限状态集合和一些从一个状态通向另一个状态的边,每条边上标记有一个符号,其中一个状态是初态,某些状态是终态。...
java过滤敏感词
Java过滤字符串的方法,Java过滤字符串的方法,过滤敏感信息
对项目中的所有参数去除前后空格过滤,统一处理参数!可以基于此过滤器实现过滤跨站脚本攻击...敏感词汇过滤。实现原理为重写HttpServletRequestWrapper,获取参数的方法。include和 Forwarded 内部转发不在过滤之内。
java使用dfa算法实现敏感词过滤,此算法效率最高,附带了一个敏感词库,轻松搞定论坛网站的敏感词过滤问题。
Java 网站敏感词过滤,里面自带词库,架包版本为2.0版本,本 Java工具包由北京师范大学2000级计算机系 张人杰 开发制作 基于多叉树的查找,我这是写了一个如何使用的例子,不懂QQ 248786960
项目概述:基于Java语言开发的UGC内容过滤系统,运用DFA算法进行敏感词汇识别,并计划引入贝叶斯学习优化过滤效果。当前项目包含57个文件,其中Java源文件43个,以及其他配置和资源文件。项目正处于实验阶段,中文...
基于简单的java基础,制作的java敏感词程序,可用于学生提交作业
利用java实现敏感词过滤的工具类,需要根据具体业务适当调整词库内容.非常实用.