`
zhangxiong0301
  • 浏览: 351108 次
社区版块
存档分类
最新评论

hiveserver2配置

    博客分类:
  • HIVE
 
阅读更多

在之前的学习和实践Hive中,使用的都是CLI或者hive –e的方式,该方式仅允许使用HiveQL执行查询、更新等操作,并且该方式比较笨拙单一。幸好Hive提供了轻客户端的实现,通过HiveServer或者HiveServer2,客户端可以在不启动CLI的情况下对Hive中的数据进行操作,两者都允许远程客户端使用多种编程语言如Java、Python向Hive提交请求,取回结果。HiveServer或者HiveServer2都是基于Thrift的,但HiveSever有时被称为Thrift server,而HiveServer2却不会。既然已经存在HiveServer为什么还需要HiveServer2呢?这是因为HiveServer不能处理多于一个客户端的并发请求,这是由于HiveServer使用的Thrift接口所导致的限制,不能通过修改HiveServer的代码修正。因此在Hive-0.11.0版本中重写了HiveServer代码得到了HiveServer2,进而解决了该问题。HiveServer2支持多客户端的并发和认证,为开放API客户端如JDBC、ODBC提供了更好的支持。

       既然HiveServer2提供了更强大的功能,将会对其进行着重学习,但也会简单了解一下HiveServer的使用方法。在命令中输入hive --service help,结果如下。从结果可以了解到,可以使用hive <parameters> --service serviceName <serviceparameters>启动特定的服务,如cli、hiverserver、hiveserver2等。

 

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. [hadoop@hadoop~]$ hive --service  help  
  2. Usage ./hive<parameters> --service serviceName <service parameters>  
  3. Service List: beelinecli help hiveserver2 hiveserver hwi jar lineage metastore metatool orcfiledumprcfilecat schemaTool version  
  4. Parametersparsed:  
  5.   --auxpath : Auxillary jars  
  6.   --config : Hive configuration directory  
  7.   --service : Starts specificservice/component. cli is default  
  8. Parameters used:  
  9.   HADOOP_HOME or HADOOP_PREFIX : Hadoop installdirectory  
  10.   HIVE_OPT : Hive options  
  11. For help on aparticular service:  
  12.   ./hive --service serviceName --help  
  13. Debug help:  ./hive --debug --help  

 

    在命令行输入hive --service hiveserver –help查看hiveserver的帮助信息:

 

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. [hadoop@hadoop~]$ hive --service hiveserver --help  
  2. Starting Hive Thrift Server  
  3. usage:hiveserver  
  4.  -h,--help                        Print help information  
  5.     --hiveconf <property=value>   Use value for given property  
  6.     --maxWorkerThreads <arg>      maximum number of worker threads,  
  7.                                  default:2147483647  
  8.     --minWorkerThreads <arg>      minimum number of worker threads,  
  9.                                   default:100  
  10.  -p <port>                        Hive Server portnumber, default:10000  
  11.  -v,--verbose                     Verbose mode  

 

       启动hiveserver服务,可以得知默认hiveserver运行在端口10000,最小100工作线程,最大2147483647工作线程。

 

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. [hadoop@hadoop~]$ hive --service hiveserver -v  
  2. Starting Hive Thrift Server  
  3. 14/08/01 11:07:09WARN conf.HiveConf: DEPRECATED: hive.metastore.ds.retry.* no longer has anyeffect.  Use hive.hmshandler.retry.*instead  
  4. Starting hive serveron port 10000 with 100 min worker threads and 2147483647 maxworker threads  

 

       接下来学习更强大的hiveserver2。Hiveserver2允许在配置文件hive-site.xml中进行配置管理,具体的参数为:

 

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. hive.server2.thrift.min.worker.threads– 最小工作线程数,默认为5。  
[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. hive.server2.thrift.max.worker.threads – 最小工作线程数,默认为500。  
  2. hive.server2.thrift.port– TCP 的监听端口,默认为10000。  
  3. hive.server2.thrift.bind.host– TCP绑定的主机,默认为localhost。  

 

       也可以设置环境变量HIVE_SERVER2_THRIFT_BIND_HOST和HIVE_SERVER2_THRIFT_PORT覆盖hive-site.xml设置的主机和端口号。从Hive-0.13.0开始,HiveServer2支持通过HTTP传输消息,该特性当客户端和服务器之间存在代理中介时特别有用。与HTTP传输相关的参数如下:

     

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. hive.server2.transport.mode – 默认值为binary(TCP),可选值HTTP。  
  2. hive.server2.thrift.http.port– HTTP的监听端口,默认值为10001。  
[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. hive.server2.thrift.http.path – 服务的端点名称,默认为 cliservice。  
  2. hive.server2.thrift.http.min.worker.threads– 服务池中的最小工作线程,默认为5。  
  3. hive.server2.thrift.http.max.worker.threads– 服务池中的最小工作线程,默认为500。  

 

 

      启动Hiveserver2有两种方式,一种是上面已经介绍过的hive --service hiveserver2,另一种更为简洁,为hiveserver2。使用hive--service hiveserver2 –H或hive--service hiveserver2 –help查看帮助信息:

 

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. Starting HiveServer2  
  2. Unrecognizedoption: -h  
  3. usage:hiveserver2  
  4.  -H,--help                        Print help information  
  5.     --hiveconf <property=value>   Use value for given property  

 

      默认情况下,HiveServer2以提交查询的用户执行查询(true),如果hive.server2.enable.doAs设置为false,查询将以运行hiveserver2进程的用户运行。为了防止非加密模式下的内存泄露,可以通过设置下面的参数为true禁用文件系统的缓存:

     

[plain] view plaincopyprint?在CODE上查看代码片派生到我的代码片
 
  1. fs.hdfs.impl.disable.cache – 禁用HDFS文件系统缓存,默认值为false。  
  2. fs.file.impl.disable.cache – 禁用本地文件系统缓存,默认值为false。  
分享到:
评论

相关推荐

    Hiveserver2 Beeline连接设置用户名和密码.docx

    本文将详细介绍如何在...基本思路是先自定义一个权限认证类接收用户名和密码,打成jar包后放到到HIVE的Lib目录下,然后配置Hive的配置文件和Hadoop的配置文件即可。本文档基于HIVE 3.12 支持最新的Hive和 Hadoop版本。

    HiveServer2自定义身份验证

    ============Hive的beeline权限配置============ 1)HDFS修改core-site.xml配置 搜索 core-site.xml ...2)YARN (MR2 Included)修改core-site.xml配置 java.sql.SQLException: Could not open client transpor

    hive配置参数及含义

    hive配置参数及含义, 在大数据维护中对hive的优化参数的配置明细

    fancyChuan#bigdata-hub#hive常用配置-配置文件1

    命令行显示当前数据库- hive thrift服务xml- hiveserver2操作日志位置xmlhive下spark相关配置。

    Apache Hue 2小时轻松搞定大数据可视化终端视频教程

    6.Hue配置集成HiveServer2 7.Hue集成Hive实战案例 第四章:Hue与RDBMS、Oozie、Impala集成 1.Hue配置集成RDBMS 2.Hue集成MySQL实战案例 3.Hue配置集成Oozie 4.Hue集成Oozie实战案例 5.Hue配置集成Hbase 6...

    hbase:实验一-Hive3安装与部署.pdf

    实验目的: 学习Hive基本知识;2)提高Linux操作技能;3)巩固Hadoop相关知识;4)了解Hive架构与相关组件。...2)配置并运行Hive服务HiveServer2;3)以beeline连接HiveServer2,可以运行初级查询命令。

    objenesis-1.2.jar

    hiveserver2windos环境下所需要的依赖 放到hive对应的lib下 然后hive-site.xml中添加配置(路径记得改一下) &lt;name&gt;hive.aux.jars.path &lt;value&gt;file:///root/apache-hive-1.2.1-bin/lib/minlog-1.2.jar,file://...

    hive2_auth-1.0.jar

    Hiveserver2 Beeline连接设置用户名和密码,通用jar包。放到hive lib路径下即可。用户名密码在配置文件hive-site.xml中配置,具体的配置方式,请参考本站博文。 &lt;name&gt;hive.jdbc_passwd.auth.root&lt;/name&gt;&lt;!--用户...

    heibaiying#BigData-Notes#Linux环境下Hive的安装部署1

    1.1 下载并解压 1.2 配置环境变量 1.3 修改配置 1.4 拷贝数据库驱动 1.5 初始化元数据库 1.6 启动 2.2 启动hiveserver2 1

    hivesql语句练习

    nohup bin/hiveserver2 1&gt;/var/log/hiveserver.log 2&gt;/var/log/hiveserver.err & 启动成功后,可以在别的节点上用beeline去连接 bin/beeline -u jdbc:hive2://mini1:10000 -n root 或者 bin/beeline ! ...

    mysql-to-hive.ktr

    从数据库(mysql)中读取数据写入HDFS并建hive表;在该转换中,需要配置2个DB链接(Mysql和HiveServer2),配置Hadoop集群(HDFS),配置子服务器(远程执行服务器)。需要实践的元数据文件:mysql-to-hive.ktr

    大数据数据仓库hive框架搭建

    大数据数据仓库hive框架搭建,从零到配置hiveserver2,通俗易懂,详细步骤注解!!!

    xmljava系统源码-bigdata:大数据平台

    组件的配置都是经过生产实践考验的配置(50PB+数据 , 1k+ server, 10w+job/天) hdfs nameservice划分 需要开发什么系统和与什么内部系统对接 主要组件介绍 大概都需要怎么样的服务器 大数据组件部署的

    hiveauthenticator:hive 权限定制

    hiveserver2 定制权限 ##目的 通过实现PasswdAuthenticationProvider接口,可以根据项目需要定制hiveserver2的认证。 ##使用 编译打包 mvn package 把打包的jar放入hive的lib目录 配置hive文件 我们一配置用户为 ...

    ClouderaHiveODBC64.msi

    ClouderaHiveODBC64.msi要想实现Tableau连接Hive数据库,需要安装一个驱动进行配置,同时服务器开启hiveserver2在后台运行。

    squirrel-sql-4.2.0-standard.jar

    SQuirreL SQL Client A Java SQL client for any JDBC compliant database ...(1)连接前先开启hiveserver2服务; (2)hive连接附加jar类不完整导致成功连接后执行sql报错; (3)修改hadoop和hive的配置文件

    14-Hive-HA

    Hive-HA思维导图,便捷整理思路,Hive的搭建方式有三种、hiveserver2的优点、架构、配置、启动、连接:beeline连接、jdbc连接

    hadoop-mini-clusters

    HiveServer2-本地HiveServer2实例 HiveMetaStore-Derby支持的HiveMetaStore 风暴-Storm LocalCluster Kafka-本地Kafka经纪人 Oozie-本地Oozie服务器-再次感谢弗拉基米尔 MongoDB-我知道...不是Hadoop ActiveMQ-...

    【63课时完整版】大数据实践HIVE详解及实战

    23. HiveServer2的介绍及三种连接方式 24.Hive元数据、fetch task和严格模式的介绍 第3章:Sqoop Sqoop及用户行为分析案例 25.CDH版本框架的介绍 26. CDH版本框架的环境部署 27.Sqoop的介绍及其实现原理 28.Sqoop的...

    2017最新大数据架构师精英课程

    105_hive beeline-hiveserver2 106_hive beeline-外部表-内部标 107_hive 分区表-桶表 108_hive word count 109_hive连接查询-union查询-load数据 110_hbase概述 111_zk架构-集群搭建-容灾演练avi 112_zk API-观察者...

Global site tag (gtag.js) - Google Analytics