Kettle:Oracle多表格批量同步数据=》mysql
Oracle 多表格批量同步数据=》MYSQL
场景
多张Oracle表格,通过轮询自动同步数据到mysql。
避免每个Oracle表格数据=》mysql都做一个转换,产生大量转换,难以管理和调整。
主要通过kettle变量,循环,字段名自动匹配,以及Oracle、mysql数据字典来实现。
初步完成Oracle表格=》mysql的初始化同步,后续增加增量同步,DDL同步,异常处理操作。
基本步骤
1. 在mysql里查找test库下有哪些表格,输出到结果记录
2. 从结果记录里面每次取一行,设置变量
3. 针对每次使用的变量值,去oracle数据源里生成对应的表输入(通过变量生成)
4. 把变量赋给表输出组件的表名
5. 表输出其他内容不做制定,因为表名和字段都和源端oracle是一样的
6. 针对每个“输出到结果记录”做循环,插入每个oracle表格数据到mysql
总体流程
步骤1:Tables in mysql(Job)
步骤2:insert into mysql(Job)
步骤2.1 set tablename(tranfomation)
步骤2.2:insert data into mysql(tranfomation)
后续问题:
l 如何做增量的数据迁移
1. 针对oracle这端有时间字段的表格
2. 记录每次迁移的系统时间
3. 增量时间是》上次系统时间 and 《本次系统时间
每张表格时间字段名字可能不一样
所以要维护一张表格时间字段记录(表名,时间字段名)
4. 每次生成表输入时,也参照生成表名变量的方式,获取时间字段名,用在表输入的sql里
5. 表输出这端,会复杂一些,包括删除、插入、更新等等操作
l 无时间字段或流水号的表格同步
l 如何做DDL同步:
1. 获取Oracle和mysql的数据字典
2. 比较表名和字段名
3. 比较字段数据类型
4. 注意数据类型映射(如oracle的varchar2《=》MySQL的varchar,oracle的data《=》MySQL的timestamp)
5. Mysql端的表格和字段同步
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341