我的编程空间,编程开发者的网络收藏夹
学习永远不晚

MySQL 5.6对大表做归档

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

MySQL 5.6对大表做归档

环境:MySQL 5.6 主从环境(Keepalived架构)

4000W行大表进行历史数据归档。

方案:为尽量降低对业务影响,决定采取下列方案。

1、在主库建立 2016、2017、2018、2019的4个历史表结构。

2、在从库建立test库,并建立 2016、2017、2018、2019的4个历史表结构,在从库的主表上用insert into语句根据时间字段把数据插入test库的2016、2017、2018、2019的历史表里面。分拆为2016、2017、2018、2019。

3、用Navicat把 2016、2017、2018、2019导出为SQL文件,并生成主表的DELETE语句的TXT文件。

4、用Python脚本把 SQL文件和 TXT文件进行处理,分批导入到 2016、2017、2018、2019的4个历史表,并删除主表的历史数据。

5、对主表进行收缩。

完成归档。

1、在主库建立历史表的表结构。

CREATE TABLE `upload_order_header_2016` (

  `id` bigint(22) NOT NULL AUTO_INCREMENT COMMENT '自增id',

  `company` varchar(25) DEFAULT NULL COMMENT '货主',

  PRIMARY KEY (`id`)

) ENGINE=InnoDB  DEFAULT CHARSET=utf8

2、从库建立test库,同样建立 历史表的表结构。

在从库上用insert into语句把2016年的历史数据插入test库的2016年的历史表。

insert into test.upload_order_header_2016 select * from log_db.upload_order_header 

where add_time < unix_timestamp('2017-01-01  00:00:00');

insert into test.upload_order_header_2017 select * from log_db.upload_order_header 

where add_time >= unix_timestamp('2017-01-01  00:00:00') and  

add_time < unix_timestamp('2018-01-01  00:00:00');

3、用 Navicat把 2016导出为SQL文件,举例:

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

导出的是纯insert的SQL脚本。

MySQL 5.6对大表做归档

导出Delete语句:

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

MySQL 5.6对大表做归档

4、使用Python脚本批量运行上述脚本。

先insert到目标主库的历史表里,再delete目标主库的历史数据。

Python脚本如下:

load_sql_v1.py:

# coding:utf8

"""

        1、更新数据库配置

        2、变更待执行文件文件名为SQL.sql

        3、执行文件

"""

import pymysql

import time

DB_IP = "192.168.22.10"

DB_USER = "DBA"

DB_PWD = "XXXXXX"

DB_DATABASE = "log_db"

WaitTime = 10

FilePath = [

'2016.sql',

]

for file in FilePath:

f = open(file, mode='r')

print(file)

content=f.readlines()

# 打开数据库连接

db = pymysql.connect(DB_IP, DB_USER, DB_PWD, DB_DATABASE, charset='utf8')

# 使用cursor()方法获取操作游标

cursor = db.cursor()

# 使用execute方法执行SQL语句

cursor.execute("SELECT VERSION()")

# 使用 fetchone() 方法获取一条数据

data = cursor.fetchone()

print("Database version : %s " % data)

for index, sql in enumerate(content):

if index % 10000 == 0:

    print('已执行 %d'%index)

if index % 20000 == 0:

    time.sleep(WaitTime)

try:

    # 执行sql语句

                    db.ping(reconnect=True)

    cursor.execute(sql)

    # 提交到数据库执行

    db.commit()

except Exception as e:

    # Rollback in case there is any error

    print(sql)

    print(e)

  ##  db.rollback()

f.close()

    # 关闭数据库连接

db.close()

5、对主表进行收缩。

用pt-osc工具做。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

MySQL 5.6对大表做归档

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

【业务系列】面对大表的归档处理

可以搞个存储过程:create table history_tmp like history;maxid=select max(id) from history;minid=select id from history where addtime>"2013-
【业务系列】面对大表的归档处理
2018-03-09

浅谈MySQL如何优雅的做大表删除

随着时间的推移或者业务量的增长,数据库空间使用率也不断的呈稳定上升状态,当数据库空间将要达到瓶颈的时候,可能我们才会发现数据库有那么一两张的超级大表!他们堆积了从业务开始到现在的全部数据,但是90%的数据都是没有业务价值的,这时候该如何处理
2022-05-18

MySQL 对于千万级的大表要怎么优化?

首先采用Mysql存储千亿级的数据,确实是一项非常大的挑战。Mysql单表确实可以存储10亿级的数据,只是这个时候性能非常差,项目中大量的实验证明,Mysql单表容量在500万左右,性能处于最佳状态。 针对大表的优化,主要是通过数据库分库分表来解决,目前比较普
MySQL 对于千万级的大表要怎么优化?
2015-09-18

利用python对mysql表做全局模糊搜索并分页实例

在写django项目的时候,有的数据没有使用模型管理(数据表是动态添加的),所以要直接使用mysql。前端请求数据的时候可能会指定这几个参数:要请求的页号,页大小,以及检索条件。"""tableName: 表名pageNum: 请求的页的编
2022-05-25

phper使用MySQL 针对千万级的大表要怎么优化?

有需要学习交流的友人请加入交流群的咱们一起,有问题一起交流,一起进步!前提是你是学技术的。感谢阅读!点此加入该群​jq.qq.com首先采用Mysql存储千亿级的数据,确实是一项非常大的挑战。Mysql单表确实可以存储10亿级的数据,只是这个时候性能非常差,项
phper使用MySQL 针对千万级的大表要怎么优化?
2020-09-12

数据库周刊28│开发者最喜爱的数据库是什么?阿里云脱口秀聊程序员转型;MySQL update误操作;PG流复制踩坑;PG异机归档;MySQL架构选型;Oracle技能表;Oracle文件损坏处理……

墨天轮数据库周刊第28期发布啦,每周1次推送本周数据库相关热门资讯、精选文章、干货文档。本周分享 开发者最喜爱的数据库是什么?阿里云脱口秀爆聊程序员转型;MySQL update误操作后进行数据库恢复;PG流复制踩坑;PG异机归档;MySQL架构选型案例;or
数据库周刊28│开发者最喜爱的数据库是什么?阿里云脱口秀聊程序员转型;MySQL update误操作;PG流复制踩坑;PG异机归档;MySQL架构选型;Oracle技能表;Oracle文件损坏处理……
2014-10-19

编程热搜

目录