`
sjsky
  • 浏览: 904823 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Hive自定义分隔符InputFormat

阅读更多

Hive默认创建的表字段分隔符为:\001(ctrl-A),也可以通过 ROW FORMAT DELIMITED FIELDS TERMINATED BY 指定其他字符,但是该语法只支持单个字符,如果你的分隔符是多个字符,则需要你自定义InputFormat来实现,本文就以简单的示例演示多个字符作为分隔符的实现。

[一]、开发环境

  • Hadoop 2.2.0
  • Hive 0.12.0
  • Java1.6+
  • Mac OSX 10.9.1

[二]、示例

 

详见:http://www.micmiu.com/opensource/hadoop/hive-inputformat-string/

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics