`
lt200819
  • 浏览: 183527 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hive 安装部署手册

    博客分类:
  • Hive
 
阅读更多

安装环境:    

      机器 只需要安装一台机器
      操作系统:mac os 10.8 64操作系统
      hadoop:版本是1.0.4,安装在/Users/~/Software/hadoop
      sun jdk:版本是1.6.0_31 64bit,安装在/usr/local/jdk
      hive:版本是0.9.0,安装在/Users/~/Software/hive

安装步骤:

1.下载  

    下载hive:http://hive.apache.org/releases.html


2.安装

(1)上传hive安装包到机器上,使用root用户登陆:   

 tar -xvf hive-0.9.0.tar.gz

(2)将解压的hive分别移动并改名为~/Software/hive

mv hive-0.9.0  ~/Software/hive

 

3.配置hive

(1)修改/usr/local/hive/bin/hive-config.sh

    在文件末尾加入

export JAVA_HOME=/usr/local/jdk  
export HIVE_HOME=/Users/~/Software/hive  
export HADOOP_HOME=/Users/~/Software/hadoop  

(2) 根据hive-default.xml复制hive-site.xml

cp /usr/local/hive/conf/hive-default.xml /usr/local/hive/conf/hive-site.xml

(3)配置hive-site.xml,主要配置项如下:
        hive.metastore.warehouse.dir:(HDFS上的)数据目录
        hive.exec.scratchdir:(HDFS上的)临时文件目录
        hive.metastore.warehouse.dir默认值是/user/hive/warehouse
        hive.exec.scratchdir默认值是/tmp/hive-${user.name}
        以上是默认值,暂时不改。
(4)改变 /usr/local/hive的目录所有者为hadoop

chown -R hadoop:hadoop /usr/local/hive

(5)配置hive的log4j:
      cp /usr/loca/hive/conf/hive-log4j.properties.template  /usr/loca/hive/conf/hive-log4j.properties
   修改/usr/loca/hive/conf/hive-log4j.properties将org.apache.hadoop.metrics.jvm.EventCounter改为org.apache.hadoop.log.metrics.EventCounter
(6)启动hive

      使用hadoop用户登陆,执行/usr/local/hive/bin/hive
(7)测试hive

hive> create TABLE pokes( id INT, name string);  
hive> SHOW TABLES; 
hive> select * from pokes; 
hive> drop table pokes;

4.优化hive

默认meta数据库为derby ,为了避免使用默认的Derby数据库(有并发访问和性能的问题),通常还需要配置元数据库为MySQL

修改配置文件conf/hive-site.xml 

复制代码
<property>
  <name>hive.metastore.local</name>
  <value>false</value>
  <description>controls whether to connect to remove metastore server or open a new metastore server in Hive Client JVM</description>
</property>

<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://mysql_server_host:3306/hivedb?createDatabaseIfNotExist=true&amp;useUnicode=true&amp;characterEncoding=latin1</value>
  <description>JDBC connect string for a JDBC metastore</description>
</property>

<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>com.mysql.jdbc.Driver</value>
  <description>Driver class name for a JDBC metastore</description>
</property>

<property>
  <name>javax.jdo.option.ConnectionUserName</name>
  <value>mysql_username</value>
  <description>username to use against metastore database</description>
</property>

<property>
  <name>javax.jdo.option.ConnectionPassword</name>
  <value>mysql_password</value>
  <description>password to use against metastore database</description>
</property>

<property>
  <name>hive.stats.dbconnectionstring</name>
  <value>jdbc:mysql://mysql_server_host:3306/hive_stats?useUnicode=true&amp;characterEncoding=latin1&amp;user=mysql_username&amp;password=mysql_password&amp;createDatabaseIfNotExist=true</value>
  <description>The default connection string for the database that stores temporary hive statistics.</description>
</property>

<property>
  <name>hive.stats.dbconnectionstring</name>
  <value>jdbc:mysql://mysql_server_host:3306/hive_stats?useUnicode=true&amp;characterEncoding=utf8&amp;user=mysql_username&amp;password=mysql_password&amp;createDatabaseIfNotExist=true</value>
  <description>The default connection string for the database that stores temporary hive statistics.</description>
</property>

<property>
  <name>hive.stats.dbclass</name>
  <value>jdbc:mysql</value>
  <description>The default database that stores temporary hive statistics.</description>
</property>

<property>
  <name>hive.stats.jdbcdriver</name>
  <value>com.mysql.jdbc.Driver</value>
  <description>The JDBC driver for the database that stores temporary hive statistics.</description>
</property>

<property>
  <name>hive.metastore.uris</name>
  <value>thrift://127.0.0.1:9083</value>
</property>
复制代码

添加metastore启动脚本bin/hive-metastore.sh

#!/bin/sh
nohup ./hive --service metastore >> metastore.log 2>&1 &
echo $! > hive-metastore.pid

添加hive server启动脚本bin/hive-server.sh

nohup ./hive --service hiveserver >> hiveserver.log 2>&1 &
echo $! > hive-server.pid

启动metastore和hive server

./hive-metastore.sh
./hive-server.sh

 

 

使用客户端连接和测试

参考之前的hive测试步骤一一执行。

如果出现
FAILED: Error in metadata: javax.jdo.JDODataStoreException: Error(s) were found while auto-creating/validating the datastore for classes. The errors are printed in the log, and are attached to this exception.
NestedThrowables:
com.mysql.jdbc.exceptions.MySQLSyntaxErrorException: Specified key was too long; max key length is 1000 bytes
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask

或者是
FAILED: Error in metadata: MetaException(message:Got exception: org.apache.thrift.transport.TTransportException null)
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask

以上错误,主要是在select操作、drop操作时,就会出错。

这样的错误,可以修改hivedb数据库编码:

mysql> alter database hivedb character set latin1;

然后重启hive metastore和hive server就可以了

mysql数据库的编码目前最好设置为latin1,否则使用hive会出现莫名其妙的问题

分享到:
评论

相关推荐

    hive安装手册.txt

    这是安装hive的手册指南,安装hive服务端和hive客户端的详细步骤。

    HADOOP2.2安装部署手册

    hadoop 2.2 spark shark hbase hive安装手册

    hadoop+Hive安装手册.doc

    针对Hadoop云平台的安装,部署,主要包括hadoop,hive,yarn的配置说明,使用的版本是Apache官方开源版本.

    Apache TEZ部署手册

    Apache TEZ 部署手册 Apache TEZ 是一个基于 Hadoop 的数据处理引擎,它提供了高性能、可扩展的数据处理能力。Apache TEZ 部署手册是一份详细的指导手册,涵盖了 Apache TEZ 的部署、配置和使用。 一、准备 在...

    LINUX虚拟机中HADOOP+HIVE完善伪分布搭建手册

    在LINUX虚拟机中搭建 HADOOP+HIVE大数据平台,完善伪分布搭建手册 。Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速...

    202x年ambari搭建大数据平台安装手册(专业完整版).pdf

    大数据平台安装手册 本文档主要介绍了使用 Ambari 搭建大数据平台的安装手册,对于大数据的安装和配置进行了详细的介绍。 大数据平台的基本概念: * 大数据是指无法在一定时间内用传统处理方式处理的巨量数据,...

    帆软安装运维手册.pdf

    本手册主要介绍了帆软的安装、部署和运维相关知识。下面是根据手册内容生成的知识点总结: 1. 环境准备 * 环境检测:环境检测工具可以检查环境是否满足安装 FineReport 所需的条件。 * 软件环境:FineReport 支持...

    ambari 大数据组件部署手册

    Apache Ambari是一种基于...Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。 本文档个人工作总结,描述如何部署、如何自定义服务、ambari基本架构等经验总结

    Hadoop安装手册_Hadoop2.0-v1.71

    第 4 章 安装部署 Hive 444.1 解压并安装 Hive 44

    安装hadoopCDH5安装服务步骤.doc

    CDH5安装手册:Apache Hadoop的服务的部署比较繁琐,需要手工编辑配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。由于需要对Hive,HBase,Impala,Spark进行功能测试,就...

    hawq 详细安装手册

    hawq 详细安装手册 hawq 详细安装手册 hawq 详细安装手册

    Hadoop实战手册

    Hive 部署和安装27#安装Hadoop集群,看EasyHadoop安装文档。27#安装Mysql,启动Mysql,检查gc++包。27#解压Hive包并配置JDBC连接地址。27#启动Hive thrift Server。27#启动内置的Hive UI。274. Hive Cli 的基本用法28#...

    CDH集群部署手册(外)

    大数据的存储,如果你想简单便捷的安装配置使用hadoop,hbase,hive等请参考该文档。文档中详细的记录了安装过程,并且简单实用。

    大数据Hadoop2.0集群搭建

    VM、hadoop、Hive、HBase、Mahout、Sqoop、Spark、Storm、Kafka的安装部署手册

    Hadoop+Hive+Spark+Kafka+Zookeeper+Flume+Sqoop+Azkaban+Scala

    Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 ...

    Cloudera Manager一步步详细部署文档(离线parcels存储库方式)

    Cloudera Manager安装手册(离线parcels存储库方式),基于CentOS操作系统一步步傻瓜式安装,截图记录整个部署过程。带集群功能验证,检查集群是否正常工作 目录 一、文档内容 3 二、软硬件环境 3 2.1.软件信息 3 ...

    大数据安装文档

    话费大量时间将hadoop、hive、hbase、spark、phoenix、sqoop、mysql主从复制等环境部署手册。

    大数据集群Cloudera Manager日常运维手册.pdf

    该手册涵盖了日常运维的基本操作,包括登录Cloudera Manager、启动和停止Management Service、启动和停止Hadoop服务、启动和停止单个节点上的Hadoop服务、修改HDFS、Hive、MapReduce、ZooKeeper等配置参数等。...

Global site tag (gtag.js) - Google Analytics