Hive数据的导入导出方式
  LUWQcQIt0mEn 2023年11月02日 63 0
1. 导入数据
方式一:load方式

语法:load data [local] inpath  数据源路径 into table tbName [overwrite] [partition(k=v)]

说明:local表示从本地文件系统中导入数据
     不加local 默认从HDFS文件系统中导入数据

情况一:数据从本地导入
    本质:将数据从本地上传到HDFS的数据仓库中

情况二:数据从hdfs加载
    本质:在HDFS上进行数据的移动(不是复制)

    注意:数据源一定需要在hdfs上存在
方式二:insert语句 (使用少)

语法:insert into  table  tbName   [partition(k=v)]    values(v,v,v,v)

此方式底层:将insert语句转换成MR任务执行
          效率较低
  • 补充:创建表时,直接导入HDFS上数据, location 指定数据表加载数据的路径

create table tbName(…)
location 'hdfs path'
  • 例如

    create table load_tb2(id int ,name string)
          > row format delimited fields terminated by '@'
          > location '/home/zhangsan/';
2.导出数据
方式一:将数据仓库中的数据表的数据导出到HDFS

export table  tbName to 'hdfs path'
方式二:将数据仓库中的数据表的数据导出到本地

dfs -get hiveDataPath  localPath
方式三:insert overwrite 命令

语法格式:insert overwrite [local] directory  path  selectExpr

说明:local表示从本地文件系统中导入数据
     不加local 默认从HDFS文件系统中导入数据   

     path 本地或者HDFS的具体导出路径

例如:insert overwrite local directory /home/zhangsan select * from tbName
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  xaeiTka4h8LY   2024年05月31日   35   0   0 Hivehadoop
  TnD0WQEygW8e   2023年11月08日   27   0   0 Hivehive
Pig
  fztgkkRjHIsV   2023年11月12日   26   0   0 PigHiveHadoophadoophivePig
LUWQcQIt0mEn