`
darkma
  • 浏览: 520974 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类

Java 识别字符编码

阅读更多

 

public class EncodingUtils {

 

// 识别字符串编码

public static String getEncoding(String str) {

if (str == null || str.trim().length() < 1)

return "";

// 常用字符编码数组

String[] encodes = new String[] { "GBK", "ISO-8859-1", "GB2312",

"GB18030", "UTF-8" };

for (String encode : encodes) {

try {

// 匹配字符编码

if (str.equals(new String(str.getBytes(), encode))) {

// 返回编码名称

return encode;

} else {

continue;

}

} catch (Exception er) {

}

}

return "";

}

}

 

 

分享到:
评论

相关推荐

    Java自动识别文件字符编码工具类.rar

    Java自动识别文件字符编码工具类 参考博客 https://blog.csdn.net/superbeyone/article/details/103036914 使用方式: String encode = EncodingDetect.getFileEncode(geoJsonFile); log.info("系统检测到文件[ {}...

    字符编码 自动识别 编码类型

    程序可以打开不同编码类型的txt文档。解决显示乱码情况 gb2312 big5 shift-jis kr thai utf8 utf16 使用方法 命令行cmd chartype /? 查看帮助

    读取创建CSV文件并自动解析文件编码方式

    读取与创建CSV文件,根据第三方jar包自动解析文件编码方式,相关jar包与使用说明

    J2EE -- 字符编码问题

    J2EE -- 字符编码问题 J2EE -- 字符编码问题 J2EE -- 字符编码问题 J2EE -- 字符编码问题

    java读写excel包括utf8转码为可识别汉字gbk

    java读写excel包括utf8转码为可识别汉字gbk,jxl方式读取excel,生成一个新的excel

    java汉字识别

    汉字识别,判断字符串是否GBK编码

    EmojiReader:一个简单的工具,可以识别字符串中的表情符号。 (JavaScript和Java)

    表情符号阅读器一个能在字符串中识别出Emoji的简单工具(支持JavaScript / Java)特性支持Unicode12规范,基于EBNF状态机的Emoji判断,比正则表达式更易维护准确判断包含Emoji的轴向长度准确切割字符串不会断开Emoji...

    jchardet-1.1jchardet-1.1jchardet-1.1

    jchardet-1.1 字符编码识别jchardet-1.1 字符编码识jchardet是mozilla自动字Java字符串(及字符)类以Unicode编码保存数据。当处理来自外部的国际性文本时,我们需要提供关于这些文本的编码,以便准确地将它们转换为...

    Java解决UTF-8的BOM问题

    Java解决UTF-8的BOM问题,使用“UnicodeInputStream”、“UnicodeReader”。

    jchardet jchardet

    jchardet-1.1 字符编码识别jchardet-1.1 字符编码识jchardet是mozilla自动字Java字符串(及字符)类以Unicode编码保存数据。当处理来自外部的国际性文本时,我们需要提供关于这些文本的编码,以便准确地将它们转换为...

    自动检测汉字GB18030编码与UTF-8编码

    想到如下特征来识别汉字: 1. 如果第1位是0就不需要判断的,一定是ASCII字符。 2. 如果第1位是1开头的,第2位是0开头的,一定是GB编码。 3. 如果第1位是非1110开头的,则一定是GB编码。 4. 多做几个汉字判断。

    EncodingDetect.java

    java识别获取文件编码的工具类,包含调用demo及注释,修复当文本为空会报空指针的bug

    将字符串中的中文做UNICODE转码,非中文忽略

    将字符串中的中文做UNICODE转码,非中文忽略 简单实用 封装好了 直接用即可

    eclipse文件编码设置、转换原理与实用工具

    2.实用工具(java写的,代码开放,使用请参考“使用示例”包里面的几个用法,代码里面有详尽的说明)用于eclipse编码设置、转换、编码分析: a.批量指定文件的编码pageEncoding,免除逐个文件点右键、属性、改文本...

    JAVA上百实例源码以及开源项目

     Java波浪文字,一个利用Java处理字符的实例,可以设置运动方向参数,显示文本的字符数组,高速文本颜色,显示字体的 FontMetrics对象,得到Graphics实例,得到Image实例,填充颜色数组数据,初始化颜色数组。...

    unicode转码工具

    一般用来做国际化的, 用UNICODE转后的字符码 很让容易让JAVA识别,因为JAVA本省就是 UNICODE编码风格

    JAVA上百实例源码以及开源项目源代码

     Java波浪文字,一个利用Java处理字符的实例,可以设置运动方向参数,显示文本的字符数组,高速文本颜色,显示字体的 FontMetrics对象,得到Graphics实例,得到Image实例,填充颜色数组数据,初始化颜色数组。...

    Java编程调用微信接口实现图文信息推送功能

    主要介绍了Java编程调用微信接口实现图文信息等推送功能,涉及java微信图文信息推送接口调用及相关文件、字符串编码转换相关操作技巧,需要的朋友可以参考下

    护照 MRZ码编码规则

    机读护照(MRP)是一种机读旅行文件(MRTD),身份页上的数据以光学字符识别格式编码。许多国家开始发行机器可读旅行证件。

    java开源包4

    WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...

Global site tag (gtag.js) - Google Analytics