wget http://mirrors.cnnic.cn/apache/zookeeper/zookeeper-3.4.5/zookeeper-3.4.5.tar.gz
tar -xzvf zookeeper-3.4.5.tar.gz
cd zookeeper-3.4.5
cp conf/zoo_sample.cfg conf/zoo.cfg
vi conf/zoo.cfg
修改:dataDir=/home/ysc/zookeeper
添加:
server.1=host001:2888:3888
maxClientCnxns=100
mkdir /home/ysc/zookeeper(注:dataDir是zookeeper的数据目录,需要手动创建)
echo 1 > /home/ysc/zookeeper/myid
启动服务:
bin/zkServer.sh start
连接服务:
bin/zkCli.sh -server host001:2181
查看服务状态:
bin/zkServer.sh status
hbase存在系统时间同步的问题,并且误差要再30s以内
sudo apt-get install ntp
sudo ntpdate -u 210.72.145.44
HBase是数据库,会在同一时间使用很多的文件句柄,大多数linux系统使用的默认值1024是不能满足的,还需要修改 hbase 用户的nproc,在压力很大的情况下,如果过低会造成 OutOfMemoryError异常
sudo vi /etc/security/limits.conf
添加:
ysc soft nproc 32000
ysc hard nproc 32000
ysc soft nofile 32768
ysc hard nofile 32768
sudo vi /etc/pam.d/common-session
添加:
session required pam_limits.so
wget http://mirrors.hust.edu.cn/apache/hbase/hbase-0.94.12/hbase-0.94.12.tar.gz
tar -xzvf hbase-0.94.12.tar.gz
cd hbase-0.94.12
vi conf/hbase-env.sh
追加:
export JAVA_HOME=/home/ysc/jdk1.7.0_40
export HBASE_MANAGES_ZK=false
export HBASE_HEAPSIZE=1000
vi conf/hbase-site.xml
加入:
<property>
<name>hbase.rootdir</name>
<value>hdfs://host001:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>host001</value>
</property>
vi conf/regionservers
改localhost为host001
因为HBase建立在Hadoop之上,Hadoop使用的hadoop*.jar和HBase使用的必须一致。所以要将 HBase lib目录下的hadoop*.jar替换成Hadoop里面的那个,防止版本冲突。
cp /home/ysc/hadoop-1.2.1/hadoop-core-1.2.1.jar /home/ysc/hbase-0.94.12/lib
rm /home/ysc/hbase-0.94.12/lib/hadoop-core-1.0.4.jar
启动hadoop并创建目录
hadoop fs -mkdir /hbase
sudo vi /etc/profile
增加:
export PATH=$PATH:/home/ysc/hbase-0.94.12/bin
source /etc/profile
启动初始 HBase 集群:
start-hbase.sh
web界面
http://host001:60010
http://host001:60030
停止HBase 集群:
stop-hbase.sh
启动额外备份主服务器,可以启动到 9 个备份服务器(总数10 个):
local-master-backup.sh start 1
local-master-backup.sh start 2 3
启动更多regionservers, 支持到99 个额外regionservers(总100个):
local-regionservers.sh start 1
local-regionservers.sh start 2 3 4 5
停止备份主服务器:
cat /tmp/hbase-ysc-1-master.pid | xargs kill -9
停止单独regionserver:
local-regionservers.sh stop 1
使用HBase命令行模式:
hbaseshell
命令演示:
创建表Person,列族basic和detail
create 'Person', 'basic', 'detail'
看有哪些表:
list
看是否有person表:
list 'person'
增加数据,动态增加列:
数据1:
put 'Person','533001198510125838', 'basic:idcard', '533001198510125838'
put 'Person', '533001198510125838','basic:name', '章子怡'
put 'Person','533001198510125838', 'detail:age', '25'
数据2:
put 'Person', '533001198510125837','basic:idcard', '533001198510125837'
put 'Person','533001198510125837', 'basic:name', '杨尚川'
put 'Person','533001198510125837', 'detail:age', '22'
查询整条数据:
get 'Person','533001198510125838'
get 'Person','533001198510125837'
查询单列数据:
get 'Person', '533001198510125837','basic:idcard'
查询多列数据:
get 'Person', '533001198510125837','basic:idcard', 'detail:age'
查询全部数据:
scan 'Person'
删除表:
disable 'Person'
drop 'Person'
相关推荐
HBase系统结构详细介绍,值得一读 HBase 不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.所谓非结构化数据存储 就是说HBase 是基于列的而不是基于行的模式,这样方面读写你的大数据内容
基于Hadoop分布式云盘系统使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我的分享、我收到的分享等五大功能模块。其中我的网盘...
大数据企业实训项目:基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注...
hadoop大数据平台技术与应用---第5章分布式数据库HBase.pdf
第零章 大数据概述(2学时) 第一章 Hadoop概述(2学时) 第二章 Hadoop环境搭建(6学时) ...第五章 分布式数据库HBase(6学时) 第六章 分布式数据仓库Hive(8学时) 第七章 综合实例(8学时)
基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我的分享、我...
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现,类似Google Bigtable利用...
人工智能-hadoop
Hbase是分布式、面向列的开源数据库 HDFS为Hbase提供可靠的底层数据存储服务,MapReduce为Hbase提供高性能的计算能力 HBase运行模式:单机模式、伪分布式模式、分布式模式 Hbase自带Zookeeper,zk为其提供稳定服务和...
掌握Hbase shell操作。 1.2实验要求: 用Hbase shell操作创建一个student表,其结构如下表所示 Row Key address score province city street Java Hadoop Math zhangsan guangdong guangzhou yinglonglu 85 80 90 ...
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储...
在大数据热潮中,推出了NoSQL数据库,这种天生就为分布式存储而设计的技术,尤其以Apache HBase为代表,占领海量数据存储技术的大半壁江山。本教视从实战角度出来,向学员们手把手掌握HBase使用精髓,让学员达到如下...
主要内容包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、数据仓库Hive、大数据离线处理辅助系统、Spark Core...
大数据原理与应用 第四章 分布式数据库HBase 对hadoop中安装hbase及创建表,Java API的调用(数据修改)
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储...
hadoop搭建 hive笔记 HDFS YARN Mapreduce ORACLE面试 oracle 优化方法总结 https://www.cnblogs.com/doudou618/p/9376424.html 数据库面试 https://blog.csdn.net/si444555666777/article/details/82111355 ...
Hadoop 云计算框架中的 HDFS 分布式文件系统和 HBase 分布式数据库,分别介绍了 HDFS 的特性、系统框架、副本存放策略和 HBase 的系统框架及数据模型。其次,重点分析了 HBase 的存储特点,通过分析 HBase 的数据...
HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储...
3. HBase: 作为分布式的 NoSQL 数据库,需要监控 HBase 集群的运行状态、Region 分布、读写性能等。 4. ZooKeeper: 作为分布式协调服务,需要监控 ZooKeeper 集群的运行状态、连接情况和数据一致性。 5. Kettle: ...
HBase 是基于 Apache Hadoop 的面向列的 NoSQL 数据库,是 Google 的 BigTable 的开源实现。HBase 是一个针对半结构化数据的开源的、多版本的、可伸缩的、高可靠的、高性能的、分布式的和面向列的动态模式数据库。 ...