HBase的安装

BIGDATA云 2018-07-13

展开全文

HBase

Hadoop一种计算框架

Hive就是基于HDFS的数据仓库架构，使用SQL可以计算HDFS上面的数据。

HBase的安装

约定：/opt/

分布式的安装

1、解压&重命名&配置环境变量

略

2、配置：

修改hbase-env.sh

export JAVA_HOME=/opt/jdk

export HBASE_MANAGES_ZK=false

修改hbase-site.xml

<name>hbase.rootdir</name>

<value>hdfs://ns1/hbase</value>

<description>hbase数据在hdfs上面存储的目录</description>

</property>

<name>hbase.cluster.distributed</name>

<description>hbase是否支持分布式存储计算</description>

</property>

<name>hbase.zookeeper.quorum</name>

<value>uplooking01:2181,uplooking02:2181,uplooking03:2181</value>

</property>

修改regionservers(HBase从节点，主节点显示进程为HMaster，从节点显示进程为HRegionServer)

uplooking02

uplooking03

验证：

1、启动：

在hmaster节点上面执行start-hbase.sh分别在

uplooking01启动HMaster进程，在uplooking02和uplooking03启动HRegionServer进程

注意：如果使用的是hbase自身的zk，还会启动一个HQuorumPeer进程

2、在web查看，在HBase对应master所在机器上面查看：http://<master-ip>:16010

注意：如果使用时1.0以下的版本，那么这个web的端口是6001

3、在shell终端

hbase shell

HBase的体系结构

逻辑模型

命名空间

namespace，就是数据库，用来区分表的

表

table，和传统关系型数据库中标的概念一模一样

行键

rowkey,用于hbase中数据的唯一标识，其作用相当于rdbms中pk，所有的关于数据的操作都要基于rowkey。

rowkey是hbase中最重要的一个概念，rowkey可以是任意类型的字符串，因为在底层就会转化为字节数组byte[]。

而且这些字节数组可以转变为字节序，进而使得hbase数据有序，为高速查询提供一个遍历。

列族(columnFamily)

cf为列的集合。由许多列组成的文件我们称之为列族文件。在创建表的时候，至少需要一个列族。

一个列族至少对应一个文件，换句话说，多个文件对应一个列族

列(Column Qualifier)

其实说白了就是rdbms中的列或者字段，注意，一个列只能依附于一个列族。

时间戳

在hbase中时间戳表示的是一条记录的版本，就可以理解为svn的版本号。可以存放多个版本的记录，默认3个版本。

单元格

由上述的列族列时间戳等等构成一个唯一的记录。

物理模型

HBase的操作

SHELL操作

创建一张表stu

name grad course

math art

Tom 5 97 87

Jim 4 89 80

> create 'stu', 'grad', 'course'

在hbase中进行表的删除的时候，首先要disable表，其次才能drop表

predicate push down ？

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： BIGDATA云 > 《HBase列式存储》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

BIGDATA云

关注对话

TA的最新馆藏

MongoDB社区版jar
银河麒麟V10 Linux 内核版本
[转] mongodb大法好，社区版在CentOS7云服务器上的安装教程
软著升级清单
[转] 治喉癌老偏方
[转] 9种中医体质的饮食调理

喜欢该文的人也喜欢更多

热门阅读换一换