ETL工具之kettle的使用之异构数据抽取MongoDB——>DB2
环境简介:
数据库版本:MongoDB 5.0.4 (查询语句:db.version(); ); DB2 9.7 ;
kettle版本: 9.2
实现目标:将MongoDB(异构化数据) 抽取到DB2(结构化数据库);并增加时间戳,区分每天的数据。
具体实现步骤:
启动kettle
安装好kettle后, 打开data-integration, 双击Spoon.bat, 等待几秒出现图形操作界面;
新建转换
点击菜单栏: 文件——新建——转换。
连接MongoDB
拖入组件Big Data 下的 MongoDB input 组件, 双击组件进行相关配置:
在 Configure Connection Tab选项里填写连接地址,端口,连接的用户,密码等;
Host name(s) or IP address(es):网络名称或者地址。可以输入多个主机名或IP地址,用逗号分隔。还可以通过将主机名和端口号与冒号分隔开,为每个主机名指定不同的端口号,并将主机名和端口号的组合与逗号分隔开。
Port:端口号
Username:用户名
Password:密码
Authenticate using Kerberos:指示是否使用Kerberos服务来管理身份验证过程。
Connection timeout:连接超时时间(毫秒)
Socket timeout:等待写操作(以毫秒为单位)的时间
在Input Options Tab选项里填写需要抽取的集合名称
在Fields Tab选项里,点击Get fields,页面会出现选择文档里的所有字段,可以在字段上右键,删除不需要接入的字段
设置完成后,点击最下方”预览“,检查是否是所需要的数据
4、获取变量,增加时间戳字段
字段选择:点击”获取选择的字段“(如有不需要的字段, 右键删除即可)
6、表输出,配置DB2连接
7、配置完成,点击保存, 运行即可。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341