Kettle数据抽取（转换）出现乱码问题解决方法

duguyiren3476

浏览: 459252 次
性别:
来自: 北京

最近访客更多访客>>

zhangyou1010

zhianchen

guochongcan

jyzbcs

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

kettle bi

转 Kettle数据抽取（转换）出现乱码问题解决方法

在kettle中进行数据抽取，如果抽取的源数据库和目标数据库不是同一个数据库，可能会导致转换后的中文出现乱码情况，原因是由于在中文环境下有的数据库客户端默认编码格式是UTF-8，而另外的数据库编码格式是GBK，这样就导致数据乱码的情况出现。

针对这个问题，只需要在Database connection中做一个配置即可，具体步骤如下：

1.点击如下图Transform或jobs的DB连接。

2.在弹出的Database Connection中选择Options选项，在Parameters下填入参数“characterEncoding”，其value为“gbk”，如下图。

这样，就能解决kettle抽取数据过程中的中文乱码问题。

附：

针对mysql数据库，如果在pentaho平台上执行kettle的数据抽取，并且在作出上述修改后仍然出现乱码的话，可以考虑以下几个方面：

1.pentaho的META-INF/context.xml中数据源的url后面添加“useUnicode=true&characterEncoding=utf8&characterSetResults=utf8”完整的配置如下

[c-sharp] view plain copy print ?

<Resource name="jdbc/bi" auth="Container" type="javax.sql.DataSource"
factory="org.apache.commons.dbcp.BasicDataSourceFactory" maxActive="20" maxIdle="5"
maxWait="10000" username="root" password="root"
driverClassName="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/bi?useUnicode=true&characterEncoding=utf8&characterSetResults=utf8"
validationQuery="select 1" />

2.检查mysql数据库server端字符集是否是utf-8，如果不是的话，修改为utf-8。具体修改方法可百度一下，网上很多介绍介绍。

分享到：

tomcat在windows 系统的后台启动

2012-01-14 15:32
浏览 12807
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论