General

常用操作

1.查看数据库

show databases;

2.选中数据库

use ddl;

3.展示所有数据库中的表

show tables;

4.显示某一个表的结构

describe dt_list_ard_d;

5.删除表

DROP TABLE IF EXISTS keywords1002;

6.指定把某结果输入到某个结果中

hive -e "set mapred.job.queue.name=root.common;select userid,filehash from common.st_common_clfile where dt='20151026' and db=0 limit 1000000;">shfile.txt

7.将数据插入到表中,overwrite会覆盖,into会追加

INSERT OVERWRITE TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...) [IF NOT EXISTS]] select_statement1 FROM from_statement;
INSERT INTO TABLE tablename1 [PARTITION (partcol1=val1, partcol2=val2 ...)] select_statement1 FROM from_statement;
hive -e"
set mapreduce.job.queuename=root.baseDepSarchQueue;
set hive.support.quoted.identifiers=none;
INSERT OVERWRITE TABLE temp.jimmy_song_houlai PARTITION (dt='2017-07-13') select '(dt)?+.+' from ddl.dt_search_ard_d 
where dt='2017-07-13' 
and inputstring='后来 刘若英' 
and is_valid=0 
and inputtype in ('1','2','4')
;">insertsampletable.txt

8.新建表并导入已有表

9.增加字段

10.删除字段(就是在replace中不写该字段,其中partition column可以不用写在replace中)

11.修改表名

该功能也支持移动数据表位置

12.修改列名

13.删除分区

14.修改字段类型

从bigint修改到double

查看该表的建立信息

建立测试表进行测试

1.新建表(如果有多行,使用' ')

2.加载数据

3.测试数据

建立正式表

1)先使用show create table dt_search_ard_d;然后将其中的符号改成'',去掉最后的属性值。 2)使用命令创建表

建立ORC表

注意很多时候由于textfile的分隔符问题,会导致select取出脏数据,因此对于歌曲名等不规则的实体,可以考虑建立orc表。

Last updated