===
=
=
一、判断中文汉字
str.matches("[\u4e00-\u9fcc]+")
Pattern pattern = Pattern.compile("[\u4e00-\u9fcc]+"); System.out.println(pattern.matcher(str).find());
缺点:只能判断汉字,不能判断中文标点符号。
二、判断中文汉字和标点
Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B //为什么这个方法缺少了呢?补上了刚刚。TODO 查查什么意思 || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) { return true; } return false;
private static boolean isChinesePuctuation(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_FORMS || ub == Character.UnicodeBlock.VERTICAL_FORMS) {//jdk1.7 return true; } return false; }
private static boolean isChineseByScript(char c) { Character.UnicodeScript sc = Character.UnicodeScript.of(c); if (sc == Character.UnicodeScript.HAN) {//jdk1.7 return true; } return false; }
缺点:汉字标点一起判断了。
三、单独判断中文标点
仔细看上一个方法中的Character.UnicodeBlock.XXX
阅读文档了解意思,自然能知道如何做。
=
=
=
相关推荐
本篇文章主要介绍了Java判断中英文符号、标点的实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
java实现含有英文字符串的符号替换为中文符号,在网上看了一些都没有详细的实现方式,看了这个就不用去摸索了,看了就会用了,下次有碰到这方面的,同样中文特殊符号转换为英文符号类似的逻辑
iText7处理行首行末中文标点符号
实现了用户输入一个字符串,能够输出该字符串包含多少字节。代码中分别统计出英文字母、数字、英文标点、中文、中文标点以及一些转义字符的个数。可以根据自己需要扩增范围
利用字符间的转化把汉字转化为英文字符主要应用于提取汉字的首字母等要求
java汉字取首字母小写转大写标点符号数字不做处理
关于java按字节截取带有汉字的字符串的解法.不错的一个程序。我也是从高手那拿来的,觉得不错,传上来给感兴趣的朋友学习学习。
IDEA自动中文转英文字符超级插件IDEA自动中文转英文字符超级插件
java 写的转pdf代码,支持表格内容的中文换行,css样式随意设置。源代码亲测好用
统计一篇文章每个字的个数,java程序,程序能够把随意的一篇文章的每一个字包括标点符号在内的个数统计出来,并在一个文档中保存
java安卓android汉字转拼音中文转拼音pinyin4j简化精简版. 网上流传的有180KB,太大了,对于android开发来说。我精简了很多无关内容,收录常用汉字大约2万个,完全够用了,还专门写了一个helper类,直接调用这个...
正则表达式只可以输入只允许输入中文、数字、字母、下划线
有《长恨歌》古诗词,在经某程序处理后,被删去了非汉字部分,如标点符号、回车换行等。现请设计程序恢复,并把恢复后的诗歌写入 D 盘某个目录下的某个文本文件。 实验步骤 1。首先导入 java.util 包下的 Scanner ...
java类创建一个马尔可夫链频率表,然后用它来生成句子。 句子的质量将完全取决于... // 您可以包含句子和标点符号。 // 生成一个句子: 字符串句子 = mc.genMarkov(int words); // 其中 words 是要生成的单词数反馈给
解决HTML转pdf 中文、数字、英文不能换行的问题,修改的源码包 重新计算了右边距
字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等等。字符串是0个或更多个字符的序列。文本也就是文字,字符串。说某个字符串匹配某个正则表达式,通常是指这个字符串里...
经过大牛修改后的core-renderer.jar,当把HTML转化成PDF时支持table的td中的中文、英文和数字自动换行,table必须添加样式table-layout:fixed;word-break:break-strict;
实例073 根据标点符号对字符串进行分行 92 实例074 将字符串的每个字符进行倒序输出 94 实例075 获取字符串中汉字的个数 94 实例076 批量替换某一类字符串 95 实例077 把异常与错误信息显示到窗体中 97 实例078 从...