`
redsky008
  • 浏览: 346668 次
  • 性别: Icon_minigender_1
  • 来自: 成都正在项目
社区版块
存档分类
最新评论

如何识别ISO-8859-1

 
阅读更多
由于网上流传的Encoding.java, Encode.java, ParseEncoding.java中对ISO-8859-1无法识别,现在可以采用如下方法,如果能识别当然输出true了,不能就是输出false
		boolean gb2312 = java.nio.charset.Charset.forName("GB2312").newEncoder().canEncode(id);
		System.out.println(gb2312 );
		boolean iso88591 = java.nio.charset.Charset.forName("ISO-8859-1").newEncoder().canEncode(id);
		System.out.println("can:" + iso88591 );
分享到:
评论

相关推荐

    二维码解码库-zxinglib-vs2010静态库(支持提取二进制数据)

    因为,项目需要支持vs2010的cpp提取二维码二进制...现通过基于zxing源码修改默认字符集为iso-8859-1及添加二进制源数据提取接口,并利用vs2010环境下编译为静态库。 zxing的github地址:https://github.com/zxing/zxing

    解决Python requests库编码 socks5代理的问题

    查了一些相关的资料,看了下requests的源码,只有在服务器响应的头部包含有Content-Type,且里面有charset信息,requests能够正确识别,否则就会使用默认的 ISO-8859-1编码。github中也有讨论这个问题,但requests的...

    Linux系统下Mp3标签乱码问题的分析和解决

    如果遇到是以gbk、gb18030、big5等编码的中文内容时,它还是会把它当成ISO-8859-1来读取,乱码就成了必然。说了这么多,现在问题就变得简单了,似乎我们只需要把mp3标签里面用gbk、gb18030、big5等编码存储的中文...

    GBK、UTF-8编码转换工具

    本程序的目的是为了把文件编码格式统一。如果文件内容编码不同,则也不能保正...缺点:比如iso-8859-1的内容转换成utf-8。则可能失败。。 优点:java文件,txt/xml/dat文件。只要都是能识别的内容,即转换成功就更大。

    mnist pkl格式文件

    mnist 手写数字数据集的pickle格式,读取代码 with open("mnist.pkl", 'rb') as f: train, val, test = pickle.load(f, encoding='iso-8859-1')

    xer:计算有用的转录指标(CER、WER、SER、...)

    这样,无论哪种编码使用您的数据(UTF-8、ISO-8859-1、Windows-1251 等),该工具都会为您提供有意义的指标。 默认为 UTF-8,但您可以使用 Python 支持的任何编码集 ( )。用法 usage: xer [-h] [-r REF] [-t HYP] ...

    机器学习入门 — 特征编码

    数值特征 ...vg_df = pd.read_csv('datasets/vgsales.csv', encoding = ISO-8859-1) vg_df[['Name', 'Platform', 'Year', 'Genre', 'Publisher']].head() # 拿到某个特征的离散数据 genres = np.uniq

    encodingchecker:文件编码检查器

    ISO-8859-1 utf-8_withoutBom utf-8_withBom UTF-16BE_withBom UTF-16BE_withoutBom UTF-16LE_withBom UTF-16LE_withoutBom UTF-32BE_withBom UTF-32BE_withoutBom UTF-32LE_withBom UTF-32LE_withoutBom

    EncodingDetect工具类动态识别文件编码

    支持本地file及指定url的编码识别,支持多达40余种编码的识别,包括最常见的UTF-8,GBK,GB2312,BIG5,UNICODE,ISO8859_1,ASCII等

    二维码编码解码器源码20130905

    此处之前是"ISO-8859-1",之所以改成UTF-8是因为,在解码的时候程序会猜测可能的编码,如果猜测失败则默认是UTF-8,代码在com.google.zxing.qrcode.decoder.DecodedBitStreamParser类的guessEncoding方法中。...

    二维码编码解码器源码

    此处之前是"ISO-8859-1",之所以改成UTF-8是因为,在解码的时候程序会猜测可能的编码,如果猜测失败则默认是UTF-8,代码在com.google.zxing.qrcode.decoder.DecodedBitStreamParser类的guessEncoding方法中。...

    EncodingDetect.java自动获取文件的编码.rar

    EncodingDetect.java,java自动获取文件的编码,智能识别文件编码,支持本地file及指定url的编码识别,支持多达40余种编码的识别,包括最常见的UTF-8,GBK,GB2312,BIG5,UNICODE,ISO8859_1,ASCII等,FileUtil....

    JSP的系统性教材

    charset用于设置网页的字符编码类型,简体中文设置为gb2312,英文设置为ISO-8859-1,此外,还有其他的字符集,如utf-8(网页不管使用什么语言都适用)。 3.定义网页的定时跳转 有些情况下,一个网页需要自动跳转到...

    Openwrt如何添加SD_Card?看这里

    一、硬件平台 1.1 控制器:MT7688 二、软件平台 2.1、开发环境:Ubuntu12.04 2.2、软件版本:openwrt-hiwooya-stable 三、功能说明 ...3、增加对语言格式的支持,如utf8、cp437、iso8859-1,用于识别sd c

    Python判断文件和字符串编码类型的实例

    # 说明:UTF兼容ISO8859-1和ASCII,GB18030兼容GBK,GBK兼容GB2312,GB2312兼容ASCII CODES = ['UTF-8', 'UTF-16', 'GB18030', 'BIG5'] # UTF-8 BOM前缀字节 UTF_8_BOM = b'\xef\xbb\xbf' # 获取文件编码类型 def

    freemarker语法完整版

    <#assign name1=value1 name2=value2 ... nameN=valueN> <#-- 或则 --> <#assign same as above... in namespacehash> <#-- 或则 --> <#assign name> capture this </#assign> <#-- 或则 --...

    tomcat环境变量配置

    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd"> <web-app> <display-name>My ...

    PT80-NEAT开发指南v1.1

    1 简介 ........................................................................................................................................................ 1 相关文档 ...............................

    oracle 客户端不支持中文解决办法

    问题描述:在Linux下安装的oracle,默认的字符集没有修改,使用的是WE8ISO8859P1,不能够支持中文, 问题表现为,客户端录入的中文数据可以显示,提交之后再查询出来后中文会显示为???。问题出在oracle服务端的字符...

    myeclipse乱码

    用于汉字显示的字符集主要有ZHS16CGB231280,US7ASCII,WE8ISO8859P1等。字符集不仅需在服务器端存在,而且客户端也必须有字符集注册。服务器端,字符集是在安装ORACLE时指定的,字符集登记信息存储在ORACLE数据库...

Global site tag (gtag.js) - Google Analytics