查看原文
其他

字节一面:MySQL 是怎么存储 NULL 的?

脚本之家 2023-09-03

The following article is from 飞天小牛肉 Author 小牛肉

将 脚本之家 设为“星标

第一时间收到文章更新

来源公众号:飞天小牛肉  ID:CS-Wiki
已获得原公众号的授权转

MySQL 怎么存储,其实问的是 InnoDB 怎么存储,如果你清楚 InnoDB 存储引擎一行记录的格式,那么关于 NULL 值怎么存放这个问题,其实还是很简单的。本题已收录至 itmtx.cn,点击文末 阅读全文 可直达刷题网站:

InnoDB 逻辑存储结构

InnoDB 中的所有数据都被逻辑地存放在一个空间中,这个空间被称之为 “表空间”(tablespace),表空间可以看作 InnoDB 存储引擎逻辑结构的最顶层,其中包含以下几个部分:

  • 段(segment):表空间是由各个段组成的,常见的段有:
    • 数据段(leaf node segment):InnoDB 是索引组织表(index organized)的,数据即索引,索引即数据,因此数据段其实就是索引(B+ 数的叶子结点)
    • 索引段(non-leaf node segment):B+ 树的非叶子节点
    • 回滚段(rollback segment):也就是 undo log 中的数据
  • 区(extent):一个段最多可以申请 4 个区,区由 64 个连续的页组成,每个页大小为 16KB,即每个区的大小为 64 * 16 = 1M
  • 页(page),也称为 “块”(block):页是 InnoDB 磁盘管理的最小单位。每个页中的数据组织形式是 “行(row)”,也就是说数据是按行进行存放的,每个页最多存放 16KB / 2 ~ 200  = 7992 行的记录

InnoDB 行记录格式

InnoDB 存储引擎提供了 Compact 和 Redundant 两种格式来存放行记录格式,MySQL 5.1 默认保存为 Compact 格式。

可以通过 show table status like 'table_name' 来查看当前表使用的行记录格式。

Redundant 是为了兼容 MySQL 5.0 之前的版本来存在的,这里就不详细说了,主要看 Compact 格式,如下所示:

首先,Compact 行格式的首部是一个非 NULL 变长字段(varchar)的长度列表,并且这个长度列表是按照列的顺序逆序放置的:

  • 当列的长度 < 255 字节,用 1 个字节标识
  • 当列的长度 > 255 字节,用 2 个字节标识

举个例子,比如有四个字段 (id, name, age, address),name 和 address 都是变长类型,有两行记录:

idnameageaddress
1Job20Los Angeles
2Julia21Panama
  • name 列的长度分别是 3 和 5,十六进制表示 0x03 和 0x05
  • address 列的长度分别是 11 和 6,十六进制表示 0xB 和 0x06

这两行记录对应的 Compact 格式如下图所示:

第二个部分就是 NULL 标识位,用于指示这行数据中是否有 NULL 值,若有的话,则将对应的比特位置为 1。具体来说,每个列对应一个二进制位(bit),二进制位同样按照列的顺序逆序排列。

比如有一行记录 id = 1, name = "admin", age = NULL,那么这行记录对应的 NULL 标位就是 100(逆序排放,[age, name, id]),然后在高位补 0,最终就是 0000 0100

第三部分是记录头信息(record header),固定占用 5 个字节(40 位),主要就是包含比如该行是否已被删除、页中下一条记录的相对位置等等之类的

<END>

程序员专属T恤

商品直购链接 👇


  推荐阅读:
这是一件程序员才懂的T恤
记一次 MySQL 主从同步异常的排查记录,百转千回!
mysql的varchar字段最大长度真的是65535吗?
高频面试:如何解决MySQL主从复制延时问题
美团面试:MySQL 自增主键一定是连续的吗?
Office 2019/2021专业增强版,正版终身授权!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存