hive数据仓库新增字段方法
短信预约 -IT技能 免费直播动态提醒
新增字段
1、方法1
alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE;
alter table 表名 add columns (列名 string COMMENT '新添加的列');
hive表中指定位置增加一个字段
分两步,先添加字段到最后(add columns),然后再移动到指定位置(change)
alter table 表名 add columns (列名 string comment '当前时间'); -- 正确,添加在最后
alter table 表名 change 列名 string after 指定位置的列名; -- 正确,移动到指定位置,address字段的后面
添加之后字段由于hive底层是文件和系列化的设计,因此查数据会发现新增的列在所有已有列的后面
CASCADE会刷历史分区字段
cascade知识
- cascade的中文翻译为“级联”,也就是不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构。
- 对于删除操作也是,级联删除表中的信息,当表A中的字段引用了表B中的字段时,一旦删除B中该字段的信息,表A的信息也自动删除。(当父表的信息删除,子表的信息也自动删除)
- 标准语法如下:
2、方法2 (适用于外部表)
当分区过多的情况下,直接使用alter就行增加字段会报错
第一步:删除分区 ,当分区过多可以写个for循环
alter table table_name drop if exists partition(par_col=col_name)
第二步:使用alter操作就行添加字段,这时候就不会因为分区过多报错
第三步:进行修复分区
msck repair table 表名;
3、方法3(下下策)
创建新表修改表名,进行存储原表数据
将原表进行drop,再对新表进行改名操作
ALTER TABLE old_name RENAME TO new_name;
修改字段
alter table table_name change column 已有列 修改名称 类型 comment '';
删除列
Hive不能直接删除列,不然底层系列化就乱了,我们可以通过replace语句来替换整张表的字段,达到同样的效果
alter table table_name replace columns(column_1 string);
语句中只写想要保留的字段就可以
以上就是hive中新增字段方法的详细内容,更多关于hive新增字段的资料请关注我们其它相关文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341