MySQL学习----MySQL架构与SQL执行流程
演化版本MySQL:MariaDB、InnoSQL 通信类型:同步、异步 链接方式:长连接、短链接 协议:tcp、unix socket
查看服务端连接数。
客户端链接与线程关系:客户端每产生一个会话session,在服务端就会有一个线程去处理这个操作。
-- mysql默认的影响范围是会话级别,如果需要展示或修改全局的则需要加上global
show global status like '%thread%';
-- 非交互形式的超时时间28800,jdbc程序
show global variables like '%wait_timeout%';
-- 交互式的超时时间28800,客户端工具datagrip等
show global variables like '%interactive_timeout%';
-- 默认客户端最大连接数151个
show global variables like '%max_connections%';
-- 查询缓存。但是这个缓存很鸡肋,如果查询语句中的大小写不一致也认为是不同语句会清除该表上一次的查询缓存。
show variables like '%query_cache%';
MySQL查询语句执行流程
select * from table where a=123
query_cache :缓存
Parser :语法解析
词法解析:将完整的SQL拆分为一个个单词
语法解析:进行语法检查
通过语法解析会得到一个解析树
pre process :预处理器
对语义进行分析,判断别名是否正确、表是否存在等
optimizer :优化器
对于一条SQL,其执行路径是可以不一样的。当有多个索引的时候,优先走哪个索引? 优化SQL:生成、选择执行路径(也称为执行计划)(基于cost的优化器)
execution plan :执行计划
// 查看实行计划
explain select * from user
// 返回json数据
explain format=json select * from user
-- 开启 100% 展示 MySQL 语句执行的神器-Optimizer Trace
show variables like '%optimizer_trace%'
-- 开启会有性能消耗
set optimizer_trace='enabled=on';
select * from information_schema.optimizer_trace
{
"query_block": {
"select_id": 1,
"cost_info": {
"query_cost": "1051502.60"
},
"table": {
"table_name": "user",
"access_type": "ALL",
"rows_examined_per_scan": 5192648,
"rows_produced_per_join": 5192648,
"filtered": "100.00",
"cost_info": {
"read_cost": "12973.00",
"eval_cost": "1038529.60",
"prefix_cost": "1051502.60",
"data_read_per_join": "2G"
},
"used_columns": [
"id",
"username",
"password"
]
}
}
}
executor :执行器
storage engine :存储引擎
InnoDB存储引擎的磁盘与内存结构
CREATE TABLE `demo`.`user_innodb` (
`id` int(0) NOT NULL,
`username` varchar(255) NULL,
`password` varchar(255) NULL,
PRIMARY KEY (`id`)
) ENGINE = INNODB;
CREATE TABLE `demo`.`user_myisam` (
`id` int(0) NOT NULL,
`username` varchar(255) NULL,
`password` varchar(255) NULL,
PRIMARY KEY (`id`)
) ENGINE = MYISAM;
CREATE TABLE `demo`.`user_memory` (
`id` int(0) NOT NULL,
`username` varchar(255) NULL,
`password` varchar(255) NULL,
PRIMARY KEY (`id`)
) ENGINE = MEMORY;
-- 给每个表中增加数据
SET @i = 1;
INSERT INTO user (id, username, password)
SELECT @i := @i + 1 AS id,
CONCAT('user', LPAD(@i, 5, '0')) AS username,
SUBSTRING(MD5(RAND()), 1, 8) AS password
FROM INFORMATION_SCHEMA.TABLES,
INFORMATION_SCHEMA.TABLES AS t2
WHERE @i < 5000000;
查看表类型存储结构(表类型也称为存储引擎)
各个存储引擎本质区别?
业务场景:
- 希望快速,不需要持久化
- 存储历史书,不需要索引,可以压缩
- 读写并发,要求一致性
一个表如何快速的插入数据?可以先通过创建MyISAM的存储引起的表,插入数据后再修改为innodb存储引擎。
官方文档对所支持的存储引擎介绍:(插拔式存储引擎) MySQL :: MySQL 5.7 Reference Manual :: 15 Alternative Storage Engines
查看存储引擎状态
show engine INNODB STATUS;
MySQL更新语句的执行流程
update user_innodb set username='huathy' where id=2056357
- 事务开始从内存(buffer pool)或磁盘(data file)读取到包含这条数据的数据页,返回给server的执行器
- server的执行器修改数据页的改行数据值
- 记录username='旧值' 到到undo log
- 记录username='huathy' 到redo log
- 调用存储引擎接口,记录数据页到buffer pool
- 提交事务(后续会刷脏到磁盘)
俩阶段提交思想。俩阶段提交是为了保证redo log和bin log内容双写一致性。这也是很多分布式事务的方案。
innoDB操作磁盘数据
预读取:局部性原理(会磁盘预读相邻的数据到内存)页16KB。 操作系统也有类似的预读4KB(4K对其)。
InnoDB内存缓冲区Buffer Pool(提升读写性能)
没有保存到磁盘文件的,暂时在缓冲区的页,称为脏页。后台线程会定时的去给他刷脏到磁盘中。
redo log
要怎么防止内存中的数据重启宕机?
为此设计了日志文件:redo log(redolog在磁盘中ib_logfile0/1)
redolog是顺序IO,而存储文件是随机IO。随机IO需要寻址,寻址就存在时间开销。延缓刷盘时机,大大提高性能。 顺序IO和随机IO:寻址有时间开销
redolog作用:保证了书的安全性,延缓刷盘时机,提高吞吐量。
- 为innodb提供了崩溃恢复的特性,实现了持久性
- redolog记录的是在某个数据页上做什么修改,属于物理日志。
- redolog的大小是固定的,前面的内容会被覆盖,一旦写满就会触发buffer pool到磁盘的同步,以便腾出空间来记录后面的修改。
undo log
记录事务发生之前的数据状态,发生异常时回滚,保证原子性。 undo log没有独立的表文件,而是存放在系统表的文件里面ibdata1
MySQL架构与内部模块
InnoDB架构
MySQL :: MySQL 5.7 Reference Manual :: 14.4 InnoDB Architecture
内存结构
内存缓冲区(Buffer Pool)LRU算法回收写满内存,冷热数据分离
内存缓冲区越大,读写性能越大。在数据库专用服务器上,可以占比80%
当内存写满后,使用LRU来回收。
把List的下表存储Map的Value中,新增、访问时移动到head,从tail淘汰。
MySQL对LRU算法进行优化,雷同JVM新生代老年代的思想。如果一个新数据过大,会放到冷数据区,如果没有被访问,就直接淘汰。即使加载大量内容,也不会淘汰热数据区的数据。这个数据区存放的是指向数据页的指针。
ChangeBuffer
ChangeBuffer是BufferPool的一部分。 如果这个数据页不是唯一索引,不存在数据重复的情况,也就不需要从磁盘加载索引页判断数据是否重复(唯一性检查)。这种情况下可以先把修改记录在内存的缓冲池中,从而提高更新语句的执行速度。
下面的参数表示,ChangeBuffer占整个BufferPool的百分比大小。如果业务场景是写多读少的话,且大部分的索引是非唯一索引,那么可以适当调大该参数。
log buffer刷盘时机
刷盘频繁,可靠性高,性能下降。如果机器稳定,可以减少刷盘,提高性能。
自适应hash索引
磁盘结构
表空间
- 系统表空间
- 通用表空间
- 独占表空间 innodb默认开启独占表空间
- 临时表空间
双写缓冲
页备份page back,解决部分写失效问题(16K写到4K,写了一半中断了)。
线程
page thread page cleaner thread io thread error monitor thread
服务端binlog
binlog是所有存储引擎都可以使用的。是以事件的形式记录了所有DDL和DML语句。记录操作而非数值,是逻辑日志。可以用来做主从复制和数据恢复。 slave请求master节点的binlog。使用binlog恢复数据需要定时全量备份数据。
崩溃恢复时候
- binlog无记录,redolog无记录:
- 在redulog写之前crash,恢复操作:回滚日志
- binlog无记录,redolog状态:prepare
- 在binlog写完之前crash,恢复操作:回滚日志
- binlog有记录,redolog状态:prepare
- 在binlog写完提交事务之前的crash,恢复操作:提交事务
- binlog有记录,redolog状态:commit
- 正常的事务,不需要恢复
转载自:https://juejin.cn/post/7218032493655572541