昨日从某点评网爬取数据
网页编码为 UTF-8, 本地的系统默认编码为 GBK
直接使用 BufferReader 读取 HttpURLConnection 打开的 stream,会导致乱码
使用 DataInputStream 的 readUTF 也引起乱码
最后使用如下代码,得到正确的文本,如下:
BufferedReader dis;
String content = new String();
String line;
try {
dis = new BufferedReader(new InputStreamReader(is, "UTF-8"));
while ((line = dis.readLine()) != null) {
content += line;
}
dis.close();
String nct = new String(content.getBytes("GBK"));
} catch (Exception e) {
e.printStackTrace();
}
分享到:
相关推荐
GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...
可以实现编码转换,使用编码utf-8转换成gbk
请使用这款软件,直接将代码转换为UTF-8 注意: 1、xml不需要转换,因为xml默认是utf-8,在你新建的时候已经是正确的格式了 2、图片更不需要转换 3、bin目录,gen目录的直接忽略 4.只需要src目录的代码转换,请确保...
UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_源码.zip
批量文件GBK-UTF8编码转换器
关于JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
GBK-BIG-UTF编码转换软件GBK-BIG-UTF编码转换软件
Java工程编码格式由GBK转化成utf-8(编码格式互转) https://ymjin.blog.csdn.net/article/details/118769530
JAVA字符编码:Unicode,ISO-8859-1,GBK,UTF-8编码及相互转换
基于MFC CString的GBK与UTF-8编码转换,在网上找到一些代码都有问题,但都存在一些错误。现在改好了,与大家分享一下。 (MFC 非UNICODE)
批量 convertz.rar GBK 转 UTF-8 gb2312 转 UTF-8 Iso-8959-1 转 UTF-8
C#写的 GBK GB2312 UTF-8转换 功能简单,仅供学习
选择目录,递归查找所有子目录的文件。遇到gb系列的编码自动转换为utf-8文件。 注意: 操作前,请自己备份文件!!! 需要在.netframework4环境下运行!!!
资源介绍:。将一个GBK编码的文本转换为URL编码,返回一个URL编码。将一个UTF8编码的文本转换为URL编码,返回一个URL编码。资源作者:。易语言在线自学。资源界面:。资源下载:。
包含GBK和UTF16字符集的对照表,用于将GBK字节流和UTF字符串之间的互相转换。
mySQL数据库latin1-gbk,gbk-utf8,gbk-big5 博文链接:https://kenter1643.iteye.com/blog/121594
主要 用于单片机 中文编码 UTF-8转GBK, 1、UTF-8 无法转GBK 2、UTF-8 转 Uincode后,再在Uincode对应GBK表中查询,查找对应数值
编码(UTF-8 GBK等等)批量转换 支持各种格式 非常适用大量需要转换编码的文件