共 55 篇文章 |
|
hive操作create,alter等。CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]... 阅39 转0 评0 公众公开 14-08-11 16:30 |
阅6008 转30 评0 公众公开 14-08-11 15:34 |
使用Ambari快速部署Hadoop大数据环境前言。/usr/lib/hadoop.2, 如果你的机器之前安装过 Hadoop的相关服务,特别是Hbase 里面配置了 HBASE_HOME 的环境变量,需要 unset掉, 这个环境变量会影响,因为我之前把这些路径放到 /etc/profile 里面导致影响了HBase,因为Ambari安装的路径和你之前安装的可能不一样.sh file_cp.sh cmd "yum -y remove ... 阅45 转0 评0 公众公开 14-08-11 11:16 |
Hadoop Ambari 安装。2、集群中ambari-serveer(管理节点)到客户端配置无密码登录。yum install ambari-server.4、运行ambari-server setup,安装ambari-server,它会自动安装配置PostgreSQL,同时要求输入用户名和密码,如果按n,它用默认的用户名/密码值:ambari-server/bigdata。安装完成后,ambari-server就可以启动了。三、Ambari安装集... 阅318 转0 评0 公众公开 14-08-11 11:06 |
Hadoop生态系统介绍1、Hadoop生态系统概况Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。下图为hadoop的生态系统:2、HDFS(Hadoop分布式文件系统)源自于Google的GFS论文,发表于2003年10月,HDFS是GFS克隆版。3、Mapreduce(分布式计算框架)源自于google的MapReduce论文,发表... 阅640 转8 评0 公众公开 14-08-11 10:58 |
(3)配置Hbase开发项目时,如何导入Hbase的配置文件 hbase-default.xml 以及 hbase-site.xml 文件?因此,在配置基于Hbase的开发项目,使用Hbase的API连接操作Hbase的时候,一个简单而可行的解决办法是将hbase-default.xml 以及 hbase-site.xml 文件直接拷贝到JAVA项目的src文件夹下,则可以正确连接Hbase了。 阅39 转0 评0 公众公开 14-08-08 17:29 |
Hbase shell 常用命令(1)hbase(main):012:0>list.hbase(main):004:0>put ''member'',''scutshuxue'',''info:age'' ,''99''hbase(main):010:0>get ''member'',''scutshuxue'',{COLUMN=>''info:age'',TIMESTAMP... 阅211 转0 评0 公众公开 14-08-08 15:02 |
export JAVA_HOME=/usr/local/java/jdk1.6.0_27 #Java安装路径export HBASE_CLASSPATH=/usr/local/hadoop/conf #HBase类路径export HBASE_MANAGES_ZK=true #由HBase负责启动和关闭Zookeeper.[root@hadoop1 hbase]# wget http://labs.mop.com/apache-mirror/hbase/hbase-0.94.5/hbase-0.94.5.tar.gz.hadoop3: starting zookeeper, logg... 阅377 转2 评0 公众公开 14-08-08 11:20 |
# rpm -q ntp.# ntp.conf(5), ntp_acc(5), ntp_auth(5), ntp_clock(5), ntp_misc(5), ntp_mon(5).主机通过NTP时钟同步与所同步时间源的时间偏移量,单位为毫秒,offset越接近于0,主机和ntp服务器的时间越接近。在ntp server上重新启动ntp服务后,ntp server自身或者与其server的同步的需要一个时间段,这个过程可能是5分钟,在这个时间之内在... 阅920 转10 评0 公众公开 14-08-08 10:57 |
1、insert into 语句。hive> insert into table userinfos2 select id,age,name from userinfos;2、insert overwrite语句。hive> insert overwrite table userinfos2 select id,age,name from userinfos;insert overwrite 会覆盖已经存在的数据,如被覆盖的表中有3条数据和要插入的一条数据相同,那么覆盖后只会有一条数据; 阅9462 转4 评0 公众公开 14-08-04 17:28 |