这两天的根据 kettle 5.0.1 源码改进成,web端可控的项目。本来项目进展顺利,接近收尾工作,不成想尽然一个系统bug,阻挡了我前进的道路。花了一个上午的时间,各种找资料,后来发现用一个jar包替换后,问题解决。没有办法的办法了。这里记录下,以防后期出现不可预知的问题。
Running an exported Job fails intermittently on carte (most likely a VFS issue)
该问题,官方关闭bug,提示修复在 5.1.0版本,结果下载测试,仍然存在致命的问题。
写道
Unexpected error during transformation metadata load
Error reading information from file
Could not read from "zip:file:///C:/Users/USER~1.OFF/AppData/Local/Temp/export_2018d2a1-674b-11df-832c-05c9548ce924.zip!/trans_003.ktr" because it is a not a file.
at org.pentaho.di.job.entries.trans.JobEntryTrans.getTransMeta(JobEntryTrans.java:1035)
at org.pentaho.di.job.entries.trans.JobEntryTrans.execute(JobEntryTrans.java:541)
Error reading information from file
Could not read from "zip:file:///C:/Users/USER~1.OFF/AppData/Local/Temp/export_2018d2a1-674b-11df-832c-05c9548ce924.zip!/trans_003.ktr" because it is a not a file.
at org.pentaho.di.job.entries.trans.JobEntryTrans.getTransMeta(JobEntryTrans.java:1035)
at org.pentaho.di.job.entries.trans.JobEntryTrans.execute(JobEntryTrans.java:541)
就像里面的哥们一样郁闷,不知道kettle团队作何感想。
写道
well, I've just tested PDI 5.1.0-GA and the problem still exists today. Indeed, the jar commons-vfs-20100924-pentaho.jar is not up to date and I still get the error described above. Check for yourself on: pdi-5.1.0-GA/design-tools/data-integration/lib.
why this issue is closed?
why this issue is closed?
最后解决的办法,也是看到讨论里有人提出用最新的common-vfs.jar 包替换原来的
commons-vfs-20100924-pentaho.jar 包,问题可以解决。至少一个下午,我这里都是相安无事的。这里简单记录一下。
知识点: 1.apache common-vfs 操作
附 :
https://github.com/pentaho/pentaho-kettle kettle github地址
http://jira.pentaho.com/browse/ kettle jira地址
相关推荐
利用kettle运行job,完成以上的两个过程.mp4Kettle研究-1-ETL认识与Kettle研读 ETL工具Kettle研究-2-Kettle安装部署 ETL工具Kettle研究-3-MySQL数据导入HIVE ETL工具Kettle研究-4-同步和更新备份表
1.介绍carte 2.carte相关配置文件的设定 3.carte服务的开启命令 4.在kettle的图形界面中对集群进行相关的设定 5.使用kettle集群模式对相关的数据进行排序 6.有关于集群调用子服务器的java源代码调用实现
在java应用程序中集成应用kettle,实现调用资源库上和本地的transformation和job。
java中调用kettle中的job与转换源码,其中kettle用的是5.2.0.0的版本。已经测试过可以调用访问,并且可以传入参数调用。有需要的可直接拿去使用。
自己照着写的 里面有kettle 常用的包
关于Kettle 转换、作业日志自动配置的解决方案
Kettle JOB执行出错,发送带附件的邮件
kettle - JOB循环 , 用于kettle失败后重试 ! 具体内容请下载查看!这里不多做解析 ! kettle - JOB循环 , 用于kettle失败后重试 ! 具体内容请下载查看!这里不多做解析 !
shell命令调用kettle,将生成的日志按月打包,并运行前一天的数据,并且参数传递冲抵kettle中的变量
《kettle子转换即映射》博客示例代码; http://blog.csdn.net/neweastsun/article/details/39804383
kettle通过在job中变量来实现循环的例子:首先从文本文件读取表名,然后循环一个个表读取数据,其中最开始的文本文件输入表名可以改为从其他地方输入(比如表输入,网络请求等)
kettle转换数据的步骤,有好多种的转换
ppt介绍了 ETL的流程以及Spoon图形化界面的简单使用,以及carte,pan.kitchen的使用
kettle使用事务的转换
kettle编写遇到的问题和解决方法,性能优化,和文本文件输入中分隔符是不可见字符等问题
此处主要以两个例子说明KETTLE可支持的数据转换操作,一个说明不同数据库表间的数据提取和加载,一个说明数据文件与数据库表间的数据提取与加载。
kettle的简单数据转换demokettle的简单数据转换demokettle的简单数据转换demo
1、可直接下载使用 2、jar包在lib文件夹下面,全部加入到程序中即可运行成功
这个kettle 的插件,它可以从一个或多个 PDF 文件中抽取文本内容,抽取后的文本一页作为一行记录,便于后续处理,如写入数据库等等。 帮助手册 http://www.xgndata.com/resources/kettle/PFR_UserGuide_zh_CN.pdf ...
Kettle资源库数据字典明细:R_DATABASE:数据库连接信息 R_DIRECTORY:kettle程序目录 R_JOB:作业 R_JOB_ATTRIBUTE:作业属性 R_JOB_HOP:作业跳 R_JOB_NOTE:作业注解 R_JOBENTRY:作业项 R_JOBENTRY_ATTRIBUTE:...