我的编程空间,编程开发者的网络收藏夹
学习永远不晚

sqoop怎么指定pg库的模式

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

sqoop怎么指定pg库的模式

这篇“sqoop怎么指定pg库的模式”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“sqoop怎么指定pg库的模式”文章吧。

sqoop是一款用于hadoop和关系型数据库之间数据导入导出的工具。你可以通过sqoop把数据从数据库(比如mysql,oracle)导入到hdfs中;也可以把数据从hdfs中导出到关系型数据库中。sqoop通过Hadoop的MapReduce导入导出,因此提供了很高的并行性能以及良好的容错性。

sqoop怎么指定pg库的模式

sqoop适合以下的人群使用:

  • 系统和应用开发者

  • 系统管理员

  • 数据库管理员

  • 数据分析师

  • 数据工程师

说明

使用sqoop导出导入数据非常的方便,但是对于postgresql(简称PG库)时就碰到了一个问题,pg库是三层结构的database——schema——table。如果想导入到某一个模式下,那就需要指定模式才可以。但是sqoop如何指定pg库的模式?

解决办法

碰到问题首先要看文档才对的。文档这里已经指出如何指定pg库的schema了。官方文档地址
文档已经说了,如果向指定schema需要添加-- --schema <name> 但是要注意的是必须在命令行的!!!!最后!!!添加才会生效。

sqoop怎么指定pg库的模式

但是,这是命令行的解决办法,如果我们使用的是java呢?在没解决之前,我的java代码是这样写的:

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

结果当然是不成功。那我哦添加-- --schema 参数试一下

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            list.add("-- --schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

结果也是不成功,显示报错不识别-- --schema 。。。为了能够使schema参数生效,废了我不少劲。。。也查了不少资料,但是查到的资料都没有关于java的schema的设置。所以。。。最终正确的解决办法是:

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始sqoop将oracle的数据导出到HDFS目录",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            // 注意这里是--是分开的,源码这里是通过--做判断的            list.add("--");            list.add("--schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }

当然你也可能会使用字符串数组,数组方式就要这样写了

// 这里只是举个示例String[] string = new String[]{"--","--schema","HERO"}

以上就是关于“sqoop怎么指定pg库的模式”这篇文章的内容,相信大家都有了一定的了解,希望小编分享的内容对大家有帮助,若想了解更多相关的知识内容,请关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

sqoop怎么指定pg库的模式

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

sqoop怎么指定pg库的模式

这篇“sqoop怎么指定pg库的模式”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“sqoop怎么指定pg库的模式”文章吧。s
2023-06-28

Win11夜间模式怎么定时? Win11在指定时间内启动暗黑模式的技巧

在夜晚使用电脑时,如果周边的环境光线暗,屏幕又是很亮的话,眼睛会很难受。此时我们可以启用夜间模式,但每次都在白天晚上进行切换的话也是很麻烦,我们可以在Windows11系python统下设置指定时间自动打开夜间模式,来看看如何操作吧!在桌面
2023-06-09

java怎么指定redis的库位

使用SpringDataRedis可指定Redis库,方法包括:添加SpringDataRedis依赖项配置Redis连接信息(指定库索引)使用@RedisHash注解(指定哈希表的库)使用@RedisValue注解(指定值对象的库)使用RedisTemplate手动指定库(用于动态指定库)
java怎么指定redis的库位
2024-04-02

makefile怎么指定依赖的动态库

在Makefile中指定依赖的动态库,需要使用`-l`参数来指定依赖的库名称。下面是一个示例:```CC=gccCFLAGS=-Wall -WerrorLDFLAGS=-L/path/to/library -lname_of_library
2023-09-21

windows中edius怎么让指定的地方模糊

这篇文章主要介绍“windows中edius怎么让指定的地方模糊”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“windows中edius怎么让指定的地方模糊”文章能帮助大家解决问题。edius让指定
2023-07-04

数据库系统中的三级模式结构指的是什么

本篇内容主要讲解“数据库系统中的三级模式结构指的是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据库系统中的三级模式结构指的是什么”吧!数据库系统的三级模式结构是指数据库系统由外模式、模式
2023-06-20

python运行找不到指定的模块怎么解决

当Python运行找不到指定的模块时,可以尝试以下几种解决方法:1. 确保模块已经安装:使用`pip`命令或其他包管理工具安装需要的模块。2. 检查模块名称拼写:确保导入的模块名称没有拼写错误。3. 检查模块路径:Python默认会在系统路
2023-08-15

jspXCMS怎么为某一篇文章指定单独的模板

本篇内容主要讲解“jspXCMS怎么为某一篇文章指定单独的模板”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“jspXCMS怎么为某一篇文章指定单独的模板”吧!文章的模板一般都是有栏目统一指定的,
2023-06-26

vue怎么格式化element表格中的时间为指定格式

这篇文章主要介绍“vue怎么格式化element表格中的时间为指定格式”,在日常操作中,相信很多人在vue怎么格式化element表格中的时间为指定格式问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”vue怎么
2023-06-30

怎么为Edm.DateTime的OData参数指定正确格式的值

这篇文章主要讲解了“怎么为Edm.DateTime的OData参数指定正确格式的值”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么为Edm.DateTime的OData参数指定正确格式的值
2023-06-03

云服务器怎么搭建v2节点模式的数据库模型

要搭建v2节点模式的数据库模型,可以按照以下步骤进行:确认V2节点数据库的结构和操作。可以通过查阅相关的文档,或者在实际环境中使用数据库管理系统来获取所需的数据库结构和操作。准备数据。准备数据应该包括V2节点中的所有表。这可能包括数据库表、主键、外键和索引,以及其他关键字和字段。创建V2节点数据库的实例。可以使用已有的数据库实例或者新建一个实际的数据库实例。在V2节点中,可以直接在数据库
2023-10-26

python中怎么使用time模块指定格式时间字符串转为时间戳

这篇“python中怎么使用time模块指定格式时间字符串转为时间戳”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“pytho
2023-07-05

云服务器怎么搭建v2节点模式的数据库

要搭建v2节点模式的数据库,需要以下步骤:确定你的数据存储服务器的位置和名称。v2是一个容器化的系统,你的系统可以通过一个名字来访问和管理数据。构建你的数据存储服务器。你可以使用现有的云服务提供商提供的数据存储服务,可以选择MySQL、PostgreSQL或Redis作为数据存储系统,也可以选择其他的数据存储服务。创建你的数据存储服务。你可以为你的数据存储服务器添加一些配置文件以便管理员
2023-10-26

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录