Impala是Cloudra公司发布的实时查询开源项目,基于Hive但使用内存进行计算,是使用CDH的首选PB级大数据实时查询分析引擎。
Impala的安装方式有两种,CM方式和手动安装,手动安装比较麻烦,需要额外的步骤验证与其他组件的交互,这里采用CM的方式安装。
1、安装准备
MySQL5.6.17版本
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm
由于版本冲突,卸载之前的MySQL5.1.71版本
[root@dnode2 lucl]# yum -y remove mysql-libs-5.1.71*
再次安装MySQL就可以了。
[root@dnode2 lucl]# rpm -ivh MySQL-server-5.6.17-1.el6.x86_64.rpm
[root@dnode2 lucl]# rpm -ivh MySQL-client-5.6.17-1.el6.x86_64.rpm
目录 | 说明 |
/usr/bin | Client programs and scripts |
/usr/sbin | The mysqld server |
/var/lib/mysq | 数据文件 |
/usr/my.cnf | 配置文件 |
2、下载CM和CDH
CM当前最新版本为5.5.1,这里安装CM5.4.0和CDH5.4.0。
http://www.cloudera.com/content/www/en-us/downloads.html
在该网站能够找到CM和CDH的下载链接,下载时选定了相应的版本后,会有安装的帮助信息。
安装CM可以使用在线安装和离线安装两种方式,在线安装也需要将基础安装包下载到本地再进行安装,安装过程中自动下载需要安装的软件,但对于带宽要求较高,由于国内的网络环境下载境外的资源时容易受到限制,影响安装速度,可以通过在本地配置yum源进行安装。
http://archive.cloudera.com/cm5/redhat/6/x86_64/cm/5.4.0/
实际需要使用的文件为RPMS/x86_64目录下的文件:
http://archive.cloudera.com/cdh5/parcels/
说明:我的虚拟机环境为Centos6.5,这里只需要下载el6版本的即可。
3、将软件发布成web服务
在nnode节点上启动HTTP服务,CM和CDH的介质需要放在HTTP服务器的root目录下。
[root@nnode ~]# service httpd start
验证Web服务:
查找httpd的根目录:
[hadoop@nnode html]$ cat /etc/httpd/conf/httpd.conf |grep var/www/html
DocumentRoot "/var/www/html"
<Directory "/var/www/html">
[hadoop@nnode html]$ ll /var/www/html
total 0
[hadoop@nnode html]$
将下载的cm及cdh目录下的文件拷贝到该根目录下:
[root@nnode html]# mv /lucl/Cloudera/cm5 .
[root@nnode html]# mv /lucl/Cloudera/cdh5 .
RPM-GPG-KEY-cloudera的下载地址为:
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
目录结构:
[root@nnode html]# pwd
/var/www/html
[root@nnode html]# ll
total 12
drwxrwxr-x 3 hadoop hadoop 4096 Jan 10 04:27 cdh5
drwxrwxr-x 4 hadoop hadoop 4096 Jan 10 06:18 cm5
-rwxr-xr-x 1 root root 1690 Jan 10 04:15 RPM-GPG-KEY-cloudera
[root@nnode html]#
cm5的目录结构为:
[root@nnode x86_64]# pwd
/var/www/html/cm5/RPMS/x86_64
[root@nnode x86_64]# ls
cloudera-manager-agent-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-daemons-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
cloudera-manager-server-db-2-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
enterprise-debuginfo-5.4.0-1.cm540.p0.165.el6.x86_64.rpm
jdk-6u31-linux-amd64.rpm
oracle-j2sdk1.7-1.7.0+update67-1.x86_64.rpm
[root@nnode x86_64]#
cdh5的目录结构为:
[root@nnode 5.4.0]# pwd
/var/www/html/cdh5/parcels/5.4.0
[root@nnode 5.4.0]# ll -h
total 1.2G
-rwxrwxr-x 1 hadoop hadoop 1.2G Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel
-rwxrwxr-x 1 hadoop hadoop 41 Jan 10 02:54 CDH-5.4.0-1.cdh5.4.0.p0.27-el6.parcel.sha1
-rwxrwxr-x 1 hadoop hadoop 42K Jan 10 02:54 manifest.json
[root@nnode 5.4.0]#
分别在cm5和parcels目录下执行createrepo .命令,为rpm建立索引
[root@nnode cm5]# createrepo .
Spawning worker 0 with 7 pkgs
Workers Finished
Gathering worker results
Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode cm5]#
# 执行后repodata目录会生成相应的文件。
[root@nnode parcels]# createrepo .
Saving Primary metadata
Saving file lists metadata
Saving other metadata
Generating sqlite DBs
Sqlite DBs complete
[root@nnode parcels]
4、配置yum源
通过cloudera网站下载repo资源文件
cloudera-manager的repo文件
https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo
cloudera-cdh的repo文件
https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/cloudera-cdh5.repo
说明:
[url]https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera[url]
和
[url]https://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera[url]
内容实际是一样的,这里就使用了一份。
[root@nnode yum.repos.d]# cat cloudera-cdh5.repo
[cloudera-cdh5]
# Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera's Distribution for Hadoop, Version 5
baseurl=http://nnode/cdh5/parcels/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera
gpgcheck = 1
[root@nnode yum.repos.d]# cat cloudera-manager.repo
[cloudera-manager]
# Packages for Cloudera Manager, Version 5, on RedHat or CentOS 6 x86_64
name=Cloudera Manager
baseurl=http://nnode/cm5/
gpgkey=http://nnode/RPM-GPG-KEY-cloudera
gpgcheck = 1
[root@nnode yum.repos.d]#
5、下载安装脚本
http://archive.cloudera.com/cm5/installer/5.4.0/cloudera-manager-installer.bin
6、执行安装
chmod u+x cloudera-manager-installer.bin
在图形界面下执行./cloudera-manager-installer.bin
7、访问验证
http://nnode:7180
- 大小: 221.4 KB
- 大小: 265 KB
- 大小: 390.4 KB
- 大小: 111.5 KB
- 大小: 71.8 KB
- 大小: 77 KB
- 大小: 44.7 KB
- 大小: 87 KB
- 大小: 66.9 KB
- 大小: 190.4 KB
分享到:
相关推荐
由于Impala的版本是CDH的,所以安装Impala的涉及到的Hive、Hadoop、Spark、Hbase等环境也要统一使用CDH版本。 本文档部署impala时所用到的Hive、Hadoop等环境的安装方式是使用tar包方式安装的(cdh版本的tar包安装...
Cloudera发布的实时查询开源项目,称比原来基于MapReduce的Hive SQL查询速度提升3~90倍。mpala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax),...此文档详细解释了Impala的安装配置和使用。
impala-2.3.0-cdh5.5.1-src.tar.gz
版本: Impala v0.6 built on Sat Feb 23 18:52:43 PST 2013 使用自定义yum 库Impala的CM详细安装。
此目录中的Docker脚本会生成CentOS 6 Docker VM并安装所有CDH组件(Hadoop,Spark,Hbase,Hive,Impala,Hue,Zookeeper,Oozie等)。 如何建立cdh容器? docker build -t docker-cdh54 . 如何运行cdh容器? ...
cdh5.4 impala 官方文档pdf
CDH5安装手册:Apache Hadoop的服务的部署比较繁琐,需要手工编辑配置文件、下载依赖包等。Cloudera Manager以GUI的方式的...由于需要对Hive,HBase,Impala,Spark进行功能测试,就采用 了Cloudera Manager方式进行安装。
ambari集成impala-3.0.0依赖cdh版本的hadoop-hbase-hive相关jar包,查hive外部表(基于hbase)
本人亲自安装测试通过后整理的的cdh5.16.2离线安装教程 CM安装及部署教程.md cloudera-manager-centos7-cm5.16.2_x86_64.tar.gz manifest.json CDH-5.16.2-1.cdh5.16.2.p0.8-el7.parcel.sha1 CDH-5.16.2-1.cdh5.16.2...
cdh6.3.0安装部署包,适合redhat7
cdh impala JAVA 代码 很实用的
10-5+Impala在腾讯灯塔的优化和实践
Impala权威安装文档
官网上面的Impala数据库ODBC驱动安装程序,适用于Windows64位操作系统。
Impala provides fast, interactive SQL queries directly on your Apache Hadoop data stored in HDFS, HBase, or the Amazon Simple Storage Service (S3). In addition to using the same unified storage ...
主要介绍了yum安装CDH5.5 hive、impala的过程详解的相关资料,非常不错 具有一定的参考借鉴价值,需要的朋友可以参考下
Cloudera JDBC Driver for Impala ,jdbc连接cdh impala 官方驱动
4,每一块知识点, 都有配套案例, 学习不再迷茫。 适用人群 1、对大数据感兴趣的在校生及应届毕业生。 2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。 3、对大数据行业感兴趣的相关人员。 ...
impala是一种新的实时大数据处理框架,本文档提供了详细的安装文档,亲测,保证成功。