Hbase作为一种非关系型数据库,以其高可靠性、高性能、面向列、可伸缩的分布式存储为大规模分布式集群进行运算提供了便利。
它利用Hadoop HDFS作为其文件存储系统;运行MapReduce来处理海量数据;Zookeeper为HBase提供了稳定服务和failover机制;Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单; Sqoop则为HBase提供了方便的数据导入功能,使得传统数据库数据、HDFS向HBase中迁移变的非常方便。
配置
1. 解压
2.设置环境变量
HBASE_HOME=/home/hadoop/hbase-.
export PATH=$PATH:$HBASE_HOME/bin
3.hbase-env.sh中的如下属性:
export JAVA_HOME=/usr/java/jdk1. //配置jdk,0.98.5后必须配置
export HBASE_MANAGES_ZK=true //此配置信息,设置由hbase自己管理zookeeper,不需要单独的zookeeper。
4.配置hbase-site.xml文件
<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/home/hadoop/appdata/zookeeper</value> //zookeeper路径
</property>
</configuration>
5.启动
bin/start-hbase.sh
会在HDFS里生成Hbase相应的文件
运行bin/hbase shell进入hbase操作界面
help命令 显示帮助信息