MySQL学习----MySQL架构与SQL执行流程

站长

2023年04月07日 20:24 · 阅读数 90

演化版本MySQL：MariaDB、InnoSQL 通信类型：同步、异步链接方式：长连接、短链接协议：tcp、unix socket

查看服务端连接数。 MySQL学习----MySQL架构与SQL执行流程客户端链接与线程关系：客户端每产生一个会话session，在服务端就会有一个线程去处理这个操作。

-- mysql默认的影响范围是会话级别，如果需要展示或修改全局的则需要加上global
show global status like '%thread%';
-- 非交互形式的超时时间28800，jdbc程序
show global variables like '%wait_timeout%';
-- 交互式的超时时间28800，客户端工具datagrip等
show global variables like '%interactive_timeout%';
-- 默认客户端最大连接数151个
show global variables like '%max_connections%'; 

-- 查询缓存。但是这个缓存很鸡肋，如果查询语句中的大小写不一致也认为是不同语句会清除该表上一次的查询缓存。
show variables like '%query_cache%';

MySQL查询语句执行流程

select * from table where a=123 MySQL学习----MySQL架构与SQL执行流程

query_cache ：缓存

Parser ：语法解析

词法解析：将完整的SQL拆分为一个个单词语法解析：进行语法检查通过语法解析会得到一个解析树 MySQL学习----MySQL架构与SQL执行流程

pre process ：预处理器

对语义进行分析，判断别名是否正确、表是否存在等

optimizer ：优化器

对于一条SQL，其执行路径是可以不一样的。当有多个索引的时候，优先走哪个索引？优化SQL：生成、选择执行路径（也称为执行计划）（基于cost的优化器）

execution plan ：执行计划

// 查看实行计划
explain select * from user
// 返回json数据
explain format=json select * from user

-- 开启 100% 展示 MySQL 语句执行的神器-Optimizer Trace
show variables like '%optimizer_trace%'
-- 开启会有性能消耗
set optimizer_trace='enabled=on';
select * from information_schema.optimizer_trace

{
  "query_block": {
    "select_id": 1,
    "cost_info": {
      "query_cost": "1051502.60"
    },
    "table": {
      "table_name": "user",
      "access_type": "ALL",
      "rows_examined_per_scan": 5192648,
      "rows_produced_per_join": 5192648,
      "filtered": "100.00",
      "cost_info": {
        "read_cost": "12973.00",
        "eval_cost": "1038529.60",
        "prefix_cost": "1051502.60",
        "data_read_per_join": "2G"
      },
      "used_columns": [
        "id",
        "username",
        "password"
      ]
    }
  }
}

MySQL学习----MySQL架构与SQL执行流程

executor ：执行器

storage engine ：存储引擎

InnoDB存储引擎的磁盘与内存结构

CREATE TABLE `demo`.`user_innodb`  (
  `id` int(0) NOT NULL,
  `username` varchar(255) NULL,
  `password` varchar(255) NULL,
  PRIMARY KEY (`id`)
) ENGINE = INNODB;

CREATE TABLE `demo`.`user_myisam`  (
  `id` int(0) NOT NULL,
  `username` varchar(255) NULL,
  `password` varchar(255) NULL,
  PRIMARY KEY (`id`)
) ENGINE = MYISAM;

CREATE TABLE `demo`.`user_memory`  (
  `id` int(0) NOT NULL,
  `username` varchar(255) NULL,
  `password` varchar(255) NULL,
  PRIMARY KEY (`id`)
) ENGINE = MEMORY;
-- 给每个表中增加数据
SET @i = 1;
INSERT INTO user (id, username, password)
SELECT @i := @i + 1 AS id,
       CONCAT('user', LPAD(@i, 5, '0')) AS username,
       SUBSTRING(MD5(RAND()), 1, 8) AS password
FROM   INFORMATION_SCHEMA.TABLES,
       INFORMATION_SCHEMA.TABLES AS t2
WHERE  @i < 5000000;

查看表类型存储结构（表类型也称为存储引擎） MySQL学习----MySQL架构与SQL执行流程

各个存储引擎本质区别？

业务场景：

希望快速，不需要持久化
存储历史书，不需要索引，可以压缩
读写并发，要求一致性

一个表如何快速的插入数据？可以先通过创建MyISAM的存储引起的表，插入数据后再修改为innodb存储引擎。

官方文档对所支持的存储引擎介绍：（插拔式存储引擎） MySQL :: MySQL 5.7 Reference Manual :: 15 Alternative Storage Engines

MySQL学习----MySQL架构与SQL执行流程

查看存储引擎状态
show engine INNODB STATUS;

MySQL更新语句的执行流程

update user_innodb set username='huathy' where id=2056357

事务开始从内存（buffer pool）或磁盘（data file）读取到包含这条数据的数据页，返回给server的执行器
server的执行器修改数据页的改行数据值
记录username='旧值' 到到undo log
记录username='huathy' 到redo log
调用存储引擎接口，记录数据页到buffer pool
提交事务（后续会刷脏到磁盘）

MySQL学习----MySQL架构与SQL执行流程俩阶段提交思想。俩阶段提交是为了保证redo log和bin log内容双写一致性。这也是很多分布式事务的方案。

innoDB操作磁盘数据

预读取：局部性原理（会磁盘预读相邻的数据到内存）页16KB。操作系统也有类似的预读4KB（4K对其）。

InnoDB内存缓冲区Buffer Pool（提升读写性能）

没有保存到磁盘文件的，暂时在缓冲区的页，称为脏页。后台线程会定时的去给他刷脏到磁盘中。

MySQL学习----MySQL架构与SQL执行流程

redo log

要怎么防止内存中的数据重启宕机？

为此设计了日志文件：redo log（redolog在磁盘中ib_logfile0/1）

redolog是顺序IO，而存储文件是随机IO。随机IO需要寻址，寻址就存在时间开销。延缓刷盘时机，大大提高性能。顺序IO和随机IO：寻址有时间开销

MySQL学习----MySQL架构与SQL执行流程

redolog作用：保证了书的安全性，延缓刷盘时机，提高吞吐量。

为innodb提供了崩溃恢复的特性，实现了持久性
redolog记录的是在某个数据页上做什么修改，属于物理日志。
redolog的大小是固定的，前面的内容会被覆盖，一旦写满就会触发buffer pool到磁盘的同步，以便腾出空间来记录后面的修改。

undo log

记录事务发生之前的数据状态，发生异常时回滚，保证原子性。 undo log没有独立的表文件，而是存放在系统表的文件里面ibdata1

MySQL架构与内部模块

MySQL学习----MySQL架构与SQL执行流程

InnoDB架构

MySQL学习----MySQL架构与SQL执行流程

MySQL :: MySQL 5.7 Reference Manual :: 14.4 InnoDB Architecture MySQL学习----MySQL架构与SQL执行流程

内存结构

内存缓冲区（Buffer Pool）LRU算法回收写满内存，冷热数据分离

内存缓冲区越大，读写性能越大。在数据库专用服务器上，可以占比80% MySQL学习----MySQL架构与SQL执行流程当内存写满后，使用LRU来回收。把List的下表存储Map的Value中，新增、访问时移动到head，从tail淘汰。 MySQL对LRU算法进行优化，雷同JVM新生代老年代的思想。如果一个新数据过大，会放到冷数据区，如果没有被访问，就直接淘汰。即使加载大量内容，也不会淘汰热数据区的数据。这个数据区存放的是指向数据页的指针。 MySQL学习----MySQL架构与SQL执行流程