我的编程空间,编程开发者的网络收藏夹
学习永远不晚

原来MySQL 数据类型也可以优化

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

原来MySQL 数据类型也可以优化

不超过范围的情况下,数据类型越小越好

应该尽量使用可以正确存储数据的最小数据类型,更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期更少。

但是要确保选择的存储类型范围足够用,如果无法确认哪个数据类型,就选择你认为不会超过范围的最小类型。

看一个案例,下面是两张字段相同,字段类型相同,只是 id 字段 emp1 是 smallint 类型, emp2 的 id 是 bigint 类型,分别向两个表插入 5000 条记录,观察一下表容量大小。

CREATE TABLE `mytest`.`emp1`  (  `id` smallint(5) NULL,  `name` varchar(255) NULL);
CREATE TABLE `mytest`.`emp2`  (  `id` bigint(5) NULL,  `name` varchar(255) NULL);

两个表的初始大小是一致的,都是 96K :

原来MySQL 数据类型也可以优化

PS:可以用如下命令查看数据文件的存放位置:

> mysql> show variables like '%datadir%';
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| datadir       | /var/lib/mysql/ |
+---------------+-----------------+
1 row in set (0.01 sec)

为了方便,写个 shell 脚本分别向两个表插入 5000 条记录:

#!/bin/bash
i=1
while [ $i -le 5000 ]
do
    mysql -uroot -p123456 mytest -e "insert into emp2 (id,name) values ($i,'n$i');"
    i=$(($i+1))
done

注意表名,emp1 和 emp2 分别执行一遍。

执行完毕,确认两个表都是 5000 条记录:

mysql> select count(*) from emp1;
+----------+
| count(*) |
+----------+
|    5000 |
+----------+
1 row in set (0.03 sec)

mysql> select count(*) from emp2;
+----------+
| count(*) |
+----------+
|    5000 |
+----------+
1 row in set (0.01 sec)

来,见证一下奇迹先:

[root@node1 mytest]# ll -h | grep emp1.ibd && ll -h | grep emp2.ibd
-rw-r-----. 1 mysql mysql 272K 8月   9 09:33 emp1.ibd
-rw-r-----. 1 mysql mysql 304K 8月   9 09:37 emp2.ibd

可以发现,两个表占用的空间竟然不一样,表 emp1 id字段类型 smallint(5) 插入 5000 条记录后占用空间为 272K ,而 emp2 id字段类型 bigint(5) 插入同样的数据后占用空间大小为 304K 。

这就是所谓 不超过范围的情况下,数据类型越小越好 。

简单就好

简单数据类型的操作通常需要更少的CPU周期

  • 1、整型比字符操作代价更低,因为字符集和校对规则是字符比较比整型比较更复杂;
  • 2、使用 MySQL 自建类型而不是字符串来存储日期和时间;
  • 3、用整型存储IP地址。

我们拿日期数据类型来举个例子,同样建两张表:

CREATE TABLE `tab1` (
  `id` smallint(5) NULL,
  `name` varchar(255) NULL,
  `ctime` date NULL
);

CREATE TABLE `tab2` (
  `id` smallint(5) NULL,
  `name` varchar(255) NULL,
  `ctime` datetime NULL
);

tab1 的 ctime 字段类型为 date ,tab2 的 ctime 字段类型为 datetime ,同样,执行 shell 脚本,插入 20000 条记录:

#!/bin/bash
i=1
while [ $i -le 20000 ]
do
    mysql -uroot -p123456 test -e "insert into tab1 (id,name,ctime) values ($i,'n$i',now());"
    i=$(($i+1))
done

原来MySQL 数据类型也可以优化

改下脚本,再向表 tab2 插入 20000 条记录。

原来MySQL 数据类型也可以优化

数据准备完毕后,我们来分别查询一下这两个表:

原来MySQL 数据类型也可以优化

look,看到了,查询两个表的 SQL 语句执行速度不一样(样本量可能还有点小)!

尽量避免 null

如果查询中包含可为 NULL 的列,对 MySQL 来说很难优化,因为可为 null 的列使得 索引 、 索引统计 和 值比较 都更加复杂。

通常情况下 null 的列改为 not null 带来的性能提升比较小,所有没有必要将所有的表的 schema 进行修改,但是应该尽量避免设计成可为 null 的列。

一切以实际情况为准 。

一些细则

整数类型

可以使用的几种整数类型:

  • TINYINT 8 bit,
  • SMALLINT 16 bit,
  • MEDIUMINT 24 bit,
  • INT 32 bit,
  • BIGINT 64 bit

尽量使用满足需求的最小数据类型。前文有述。

字符和字符串类型

varchar :根据实际内容长度保存数据。

使用最小的符合需求的长度:

varchar(n) :n小于等于255使用额外一个字节保存长度,n>255使用额外两个字节保存长度。

varchar(5) 与 varchar(255) 保存同样的内容,硬盘存储空间相同,但内存空间占用不同,是指定的大小 。

varchar在 MySQL 5.6 之前变更长度,或者从255一下变更到255以上时,都会导致 锁表 。

varchar应用场景:

存储长度波动较大的数据,如:文章,有的会很短有的会很长;

字符串很少更新的场景,每次更新后都会重算并使用额外存储空间保存长度;

适合保存多字节字符,如:汉字,特殊字符等。

char:固定长度的字符串

最大长度:255;

会自动删除末尾的空格;

检索效率、写效率 会比varchar高,以空间换时间。

char 使用场景:

存储长度波动不大的数据,如:md5摘要;

存储短字符串、经常更新的字符串。

BLOB 和 TEXT 类型

MySQL 把每个 BLOB 和 TEXT值当作一个独立的对象处理。

两者都是为了存储很大数据而设计的字符串类型,分别采用二进制和字符方式存储。

日期时间

datetime

  • 占用8个字节;
  • 与时区无关,数据库底层时区配置,对 datetime 无效;
  • 可保存到毫秒;
  • 可保存时间范围大;
  • 不要使用字符串存储日期类型,占用空间大,损失日期类型函数的便捷性。

timestamp

  • 占用4个字节;
  • 时间范围:1970-01-01到2038-01-19;
  • 精确到秒;
  • 采用整形存储;
  • 依赖数据库设置的时区;
  • 自动更新timestamp列的值。

date

  • 占用的字节数比使用字符串、datetime、int存储要少,使用date类型只需要3个字节;
  • 使用date类型还可以利用日期时间函数进行日期之间的计算;
  • date类型用于保存1000-01-01到9999-12-31之间的日期。

使用枚举代替字符串类型

有时可以使用 枚举 类型代替常用的字符串类型,MySQL 存储枚举类型会非常紧凑,会根据列表值的数据压缩到一个或两个字节中,MySQL 在内部会将每个值在列表中的位置保存为整数,并且在表的 .frm 文件中保存“数字-字符串”映射关系的查找表。

特殊类型数据

曾经我使用 varchar(15) 来存储 ip 地址,然而,ip 地址的本质是 32 位无符号整数不是字符串,可以使用 INET_ATON 和 INET_NTOA 函数在这两种表示方法之间转换。

比如:

mysql> select inet_aton('192.168.134.119');
+------------------------------+
| inet_aton('192.168.134.119') |
+------------------------------+
|                   3232269943 |
+------------------------------+
1 row in set (0.03 sec)

mysql> select inet_ntoa('3232269943');
+-------------------------+
| inet_ntoa('3232269943') |
+-------------------------+
| 192.168.134.119         |
+-------------------------+
1 row in set (0.03 sec)

到此这篇关于原来MySQL 数据类型也可以优化的文章就介绍到这了,更多相关MySQL 数据类型 内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

原来MySQL 数据类型也可以优化

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

MySQL数据类型优化原则

MySQL支持的数据类型很多,选择正确的数据类型对于高性能至关重要。下面几个简单的原则都有助于做出更好的选择。更小的通常更好应该尽量使用可以正确储存数据的最小数据类型。更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处
2022-05-31

MySQL中的数据类型和schema优化

最近在学习MySQL优化方面的知识。本文就数据类型和schema方面的优化进行介绍。1. 选择优化的数据类型MySQL支持的数据类型有很多,而如何选择出正确的数据类型,对于性能是至关重要的。以下几个原则能够帮助确定数据类型:更小的通常更好应尽可能使用可以正确存

	MySQL中的数据类型和schema优化
2022-04-18

详解MySQL中的数据类型和schema优化

最近在学习MySQL优化方面的知识。本文就数据类型和schema方面的优化进行介绍。1. 选择优化的数据类型 MySQL支持的数据类型有很多,而如何选择出正确的数据类型,对于性能是至关重要的。以下几个原则能够帮助确定数据类型:更小的通常更好
2022-05-19

深入理解MySQL数据类型的选择优化

目录前言1 整数类型2 实数类型3 字符串类型3.1 VARCHAR和CHAR类型3.1.1 最大长度3.2 Binary和VarBinary类型3.3 BLOB和TEXT类型3.3 ENUM类型4 日期和时间类型5 位数据类型6 选择优化
2022-08-10

Bokeh可以用于创建哪些类型的地理空间数据可视化

Bokeh可以用于创建以下类型的地理空间数据可视化:散点图:通过在地图上绘制散点来表示不同地理位置的数据点。热力图:通过在地图上绘制颜色渐变来表示数据点的密度或价值,以显示地理空间上的热点分布。路径图:通过绘制路径或线条来表示地理空间上的路
Bokeh可以用于创建哪些类型的地理空间数据可视化
2024-05-21

如何实现MySQL底层优化:数据类型选择与存储空间优化

MySQL是一款广泛使用的关系型数据库管理系统,其底层优化对于数据库的性能和稳定性至关重要。本文将对MySQL数据类型选择与存储空间优化进行详细介绍,并给出具有实际意义的代码示例。一、数据类型选择与优化1.常见数据类型介绍MySQL支持多种
如何实现MySQL底层优化:数据类型选择与存储空间优化
2023-11-08

如何设计一个优化的MySQL表结构来实现数据可视化功能?

如何设计一个优化的MySQL表结构来实现数据可视化功能?数据可视化是现代数据分析和决策制定的重要工具。而实现数据可视化功能的基础是一个优化的数据库表结构。本文将介绍如何设计一个优化的MySQL表结构来实现数据可视化功能,并提供具体的代码示例
如何设计一个优化的MySQL表结构来实现数据可视化功能?
2023-10-31

编程热搜

目录