RT,就是利用BIG5与GB2312码的对照表,代码本身很容易,只是找对照表花了我很长时间.
java 代码
- import
java.io.*;
-
-
-
-
-
- public
class
Big2Gb{
-
private
static
final
String tabFile =
"bg-gb.tab"
;
-
private
static
byte
[] data;
-
static
{
-
try
{
- FileInputStream fis =
new
FileInputStream(tabFile);
-
int
len =fis.available();
- data =
new
byte
[len];
- fis.read(data);
- fis.close();
- }
catch
(Exception ex){
- ex.printStackTrace();
- System.exit(
1
);
- }
- }
-
-
-
-
-
private
static
int
indexOf(
int
big){
-
int
high =(big>>>
8
)&
0xff
;
-
int
low =big&
0xff
;
-
- high -=
0xa1
;
-
if
(low<=
0x7e
) low -=
0x40
;
-
else
low -= (
0xa1
-
0x7e
-
1
) +
0x40
;
-
-
return
2
*(high*
157
+low);
- }
-
-
-
-
-
-
-
public
static
byte
[] translateBig5ToGb(
byte
[] bs){
-
int
index =
0
;
-
while
(index<bs.length){
-
int
high =bs[index]&
0xff
;
-
if
(high>=
0xa1
&&high<=
0xfe
){
- index ++;
-
if
(index>=bs.length)
break
;
-
int
low =bs[index]&
0xff
;
-
if
(low<
0x40
||low>
0xfe
)
continue
;
-
if
(low>
0x7e
&&low<
0xa1
)
continue
;
-
int
offset =indexOf((high<<
8
)|low);
- bs[index-
1
] =data[offset];
- bs[index ] =data[offset+
1
];
- index++;
- }
-
else
index++;
- }
-
return
bs;
- }
-
-
public
static
String translateBig5ToGb(String big){
- String result =
null
;
-
try
{
-
byte
[] bs =big.getBytes(
"big5"
);
- bs =translateBig5ToGb(bs);
- result =
new
String(bs,
"gb2312"
);
- }
catch
(Exception e){
- }
-
return
result;
- }
-
- }
分享到:
相关推荐
反之,如果要将Big5编码转换为GB2312,可以使用类似的代码: ```vb Function Big5ToGB2312(ByVal big5String As String) As String Dim gb2312String As String gb2312String = StrConv(big5String, ...
标题中的“BIG5转换为GB2312 c代码资源”指的是一个C语言实现的程序,用于将使用BIG5编码的字符集转换成GB2312编码。BIG5是台湾和香港地区广泛使用的传统中文字符编码,而GB2312是中国大陆的标准简体中文字符集。这...
标题和描述中提到的"编码转换器 绿色版 gb2312 gbk utf-8 万能转换"是一个软件工具,它能够帮助用户将文本文件从一种编码格式转换到另一种,尤其是GB2312、GBK和UTF-8这三种常见的中文编码格式。 1. **编码系统**:...
总的来说,“简体繁体转换利器gb2312,big5,utf-8各种编码批量互转”是一个强大而实用的工具,它能有效地帮助我们解决中文字符编码转换的问题,提高工作效率,减少由于编码不匹配带来的困扰。对于需要处理中文文本的...
"GB/BIG5/UTF-8 文件编码批量转换程序"就是解决这个问题的工具,它可以将GB2312(GBK)、BIG5编码的文件批量转换为UTF-8编码,确保在各种环境中正确显示文本。 3. **批量转换** 批量转换功能使得用户无需逐个文件...
标题中的"Big5-GB-Unicode互相转换程序.zip"表明这是一个关于字符编码转换的软件包,主要用于在Big5、GBK(GB2312)和Unicode之间进行转换。Big5是繁体中文常用的编码方式,而GBK(GB2312)是简体中文的标准编码,...
例如,如果你收到一份BIG5编码的繁体中文文档,但在大陆使用GB或UTF-8编码的系统上打开会出现乱码,这时使用这个工具将文件转换为GB2312或UTF-8即可正常显示。 批量转换功能是该工具的一大亮点,这意味着你可以一次...
本资源主要关注的是“记事本”的各种编码转换,包括GBK、GB2312、UNICODE(UTF-16)以及UTF-8等格式。下面将详细介绍这些编码类型及其相互转换的方法。 首先,GBK编码,全称为“汉字内码扩展规范”,是在GB2312基础...
# 假设我们已经有了一个将Big5编码转换为Unicode的函数 unicode_char = big5_to_unicode(big5_char) # 使用gbk编码将Unicode字符编码为GB码 gb_char = unicode_char.encode('gbk') return gb_char # 同理...
"vc在GB码和Big5码间转换字符编码转换"的主题涉及到两个主要的中文编码标准:GB码(GBK)和Big5码,以及如何在它们之间进行转换。在Windows环境下,VC++(Visual C++)常用于开发这样的转换程序。 GB码,全称为...
在【GB2UTF8.exe】这个程序中,我们可以看到它提供了一个从GB编码到UTF-8的转换功能。这个过程涉及到字符的解码和编码两个步骤。首先,程序读取GB编码的文件,将每个字节对解码为对应的汉字;然后,再将这些汉字编码...
例如,一个使用UTF-8编码的网站可能需要与使用GB2312编码的数据库交互,或者一个BIG5编码的文本文件需要在UTF-8环境下打开。不正确的编码可能导致乱码问题,使得文本无法正确读取。 编码转换的方法有很多,包括使用...
这个名为`Big5ToGBK`的压缩包文件很可能包含了一个实现上述功能的源代码文件,供开发者参考和使用。通过编译和运行这些代码,你可以实现Big5编码和GBK编码之间的实际转换。 总之,Big5和GBK编码是中文字符在不同...
这时,就需要通过编码转换器将文件转换为目标系统能识别的编码,如UTF-8。 至于压缩包内的“CueCode”,这可能是指转换器的源代码或者相关的配置文件。如果它是源代码,那么用户或开发者可以通过查看和修改这些代码...
"basBIG2GB.bas"很可能是一个包含转换函数的基础模块,它通过查表的方式,将BIG5码转换为GB码,或者反之。 "Demo.exe"是编译后的可执行文件,用户可以直接运行以体验转换功能。"frmDemo.frm"和"frmDemo.frx"是VB...
描述中提到的“将 GB、BIG5、UTF-8 文件相互转换”,意味着该程序具备了双向转换功能,不仅可以将GB或BIG5编码的文件转换为UTF-8,还可以将UTF-8编码的文件转换成GB或BIG5。这对于需要在不同编码系统间进行数据迁移...