假设有一个TSV格式的数据文件test.dat(TSV是指数据文件中的每个字段是以制表符隔开的) 首先,将test.dat上传到hdfs上,具体的命令如下: hadoop fs -copyFromLocal test.dat的路径名 /tmp/test.dat(/tmp是hdfs上的一个目录) 执行以下命令就可以查看hdfs上的tmp目录下是否有刚刚上传的文件 hadoop -fs ls /tmp 然后就可以用hbase中的命令接口将该数据导入到HBASE中已经建好的表中(假设建好的表是test,列族为Info) 注:test.dat中的数据存储格式是userid\tmusic\t\time\tnetid,以time为rowkey bin/hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=info:userid,info:musicid,HBASE_ROW_KEY,info:netid test(HBASE的表明) /tmp/test.dat(hdfs文件路径) |
|
来自: IT技术武馆 > 《Hadoop及生态圈相关》