IO流读文件中文乱码 -

明天的昨天

浏览: 225802 次
性别:
来自: 上海

最近访客更多访客>>

fireqiao

Jumping_

yuxz1028

KevinLoveDev

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

IO流读文件中文乱码

博客分类：

Java核心

百度虚拟机 JVM

一段很简单读文件代码

public class TestFileReader {
    public static void main(String[] args) {
        FileReader fr=null;
        BufferedReader br=null;
        try {
            fr=new FileReader("D:/ncolog1.txt");
            br=new BufferedReader(fr);
            String read=null;
            while((read=br.readLine())!=null){
                System.out.println(read);
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally{
            try {
                if(fr!=null){
                    fr.close();
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    }
}

在一台机器上测试输出正常数据，另外一台机器中文乱码。

查看JVM 文件编码参数

String encoding = System.getProperty("file.encoding");

输出正常机器上显示为GBK,中文乱码机器上显示为UTF-8.

用EditPlus查看ncolog1.txt编码为ANSI.

百度ANSI编码的信息

这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式，称为 ANSI 编码。
在简体中文系统下，ANSI 编码代表 GB2312 编码。

解决方法

1. 运行时，加虚拟机参数 -Dfile.encoding=GBK

InputStreamReader read = new InputStreamReader(new FileInputStream("D:/ncolog1.txt"),"GBK");
BufferedReader reader=new BufferedReader(read);

附：

关于ansi编码的BUG
　　很多细心的人会发现，当新建文本文档只输入“联通”2字保存再打开时将是乱码。
　　当txt文档中一切字符都在 C0≤AA≤DF 80≤BB≤BF 这个范围时，notepad都无法确认文档地格式，没有自动依照UTF-8格式来"Display"。 而"联通"就是C1 AA CD A8，刚好在上面地范围内，所以不能正常显现。
　　记事本默认是以ANSI编码保存文本文档的，而正是这种编码存在的bug招致了上述怪现象。假如保存时选择Unicode、Unicode(big endian)、UTF-8编码就正常了。此外，假如以ANSI编码保存含有某些特别符号的文本文档，再次打开后符号也会变成英文问号。例如输入英文 this app can break 以ANSI编码保存也会变成乱码

分享到：

java NIO 学习笔记1 | ExtJS常见问题问答

2010-12-08 21:58
浏览 3498
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IO流读文件中文乱码

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

IO流读文件 中文乱码

评论

发表评论

相关推荐

java final域

java中 Class.getResource用法

java NIO 学习笔记2 Byte Buffers

java NIO 学习笔记1

Common Errors in Setting Java Heap Size

java 正则表达式4

java 正则表达式 常见问题

java 正则表达式3

java 正则表达式2

java 正则表达式1

List.isEmpty

getCanonicalName getSimpleName getName 区别与应用

字节流转化为字符流

HttpClient4.0.1学习参考网页

PrintWriter 中 write() 与 print() 的区别

缺少jar包异常 汇总

json-lib 实际使用中发生的错误

Calendar 确定日期是一周中的第几天

JDK JRE Path CLASSPATH

最近访客更多访客>>

IO流读文件中文乱码

java 正则表达式常见问题

缺少jar包异常汇总