33 | 我查这么多数据，会不会把数据库内存打爆？

**全表扫描对 Server 的影响**

假设执行以下语句进行全表扫描：
```
mysql -h$host -P$port -u$user -p$pwd -e "select * from db1.t" > $target_file
```
取数据和发数据的流程是这样的：
1. 获取一行，写到 net_buffer 中。这块内存的大小由参数 net_buffer_length 定义，默认为 16K
2. 重复获取行，知道 net_buffer 写满，调用网络接口发出去
3. 如果发生成功，就清空 net_buffer ，然后继续取下一行，并写入 net_buffer
4. 如果发生函数返回 EAGAIN 或 WSAEWOULDBLOCK，就表示本地网络栈（socket send buffer）写满了，进入等待。直到网络栈重新可写，再继续发送。
![a027c300d7dde8cea4fad8f34b670ebd](https://user-images.githubusercontent.com/24617415/68005514-7cd09980-fcb0-11e9-8328-44ac01daaf9c.jpg)
从图中可以知道：
1. 一个查询在发送过程中，占用的 MySQL 内部的内存最大就是 net_buffer_length 的大小
2. socket send buffer 也不会太大，如果 socket send buffer 被写满，就会暂停读数据的流程
所以内存是不会被打爆。
并且也可以知道，MySQL 是边读边发的，这也就意味着，如果客户端接收的慢，会导致 MySQL 服务端由于结果发送不出去，这个事务的执行时间会变长。

如果故意让客户端不去读 socket receive buffer 中的内容，然后在服务端 show processlist 可以看到：
![image](https://user-images.githubusercontent.com/24617415/68005752-3c255000-fcb1-11e9-9a6f-1b5b166df2f9.png)
State 值会处于 Sending to client 状态，表示服务器端的网络栈写满了。
真实场景中，如果客户端使用 -quick 参数，MySQL 会使用 mysql_use_result 方式，而这个方法是读一行处理一行，如果一个业务的逻辑比较复杂，每读一行数据都处理的很慢，就会导致客户端要过很久才会去取下一行的数据，就会出现上述的情况
因此，对于正常的线上业务来说，如果一个**查询的返回结果不会很多**的话，建议使用 mysql_store_result 接口，直接把查询结果保存到本地内存
如果在 MySQL 中看到多个线程都处于 Sending to client 状态，就应该去优化查询结果，并评估返回结果是否过多。如果要减少处于这个状态的线程，可以将 net_buffer_length 参数调大

与 Sending to client 长的类似的状态是 Sending data，Sending data 并不一定是指正在发送数据，也可能是处于执行器过程中的任意阶段。
实际上，一个查询语句的变化状态是这样的（略去了其他无关状态）：
- MySQL 查询语句进入执行阶段后，首先把状态设置为 Sending data
- 然后，发送执行结果的列相关信息（meta data）给客户端
- 再继续执行语句的流程
- 执行完成后，把状态设置成空字符串
可以通过构造一个锁等待的场景，就能看到 Sending data 状态：
![image](https://user-images.githubusercontent.com/24617415/68006432-814a8180-fcb3-11e9-8595-8ac67f5fc558.png)
![image](https://user-images.githubusercontent.com/24617415/68006441-85769f00-fcb3-11e9-8cf7-0d60746d125d.png)
总的来说，Sending to client 状态表示一个线程处于等待客户端接收结果的状态，Sending data 状态表示正在执行

**全表扫描对 InnoDB 的影响**

InnoDB 内存的数据页是在 Buffer Pool（BP）中管理的，在 WAL 里 Buffer Pool 起到了加速更新的作用。其实，Buffer Pool 也有加速查询的作用。 
这里涉及到一个问题：由于有 WAL 机制，当事务提交的时候，磁盘上的数据页是旧的，如果这时候马上有一个查询要读这个数据页，是不是要把 redo log 应用到数据页呢？
答案是不需要，因为这时候内存数据页的结果是最新的，直接读内存页即可，所以说 Buffer Pool 有加速查询的作用

但是 Buffer Pool 对查询的加速效果依赖于内存命中率。可以在 show engine innodb status 结果中查看系统的当前的 BP 命中率（Buffer pool hit rate）。一般情况下，一个稳定的线上系统，要保证响应时间符合要求，内存命中率要在 99% 以上

InnoDB Buffer Pool 的大小由参数 innodb_buffer_pool_size 决定，一般建议设置成可用物理内存的 60%~80%

InnoDB 内存管理用的是最近最少使用（Last Recently Used，LRU）算法，不过对其进行了改进。因为原始的 LRU 算法在进行全表扫描时，会把 Buffer Pool 中的数据全部淘汰，存入扫描过程中访问到的数据，这会导致 Buffer Pool 的内存命中率下降，磁盘压力增加，SQL 语句响应变慢

在 InnoDB 实现上，按照 5：3 的比例把整个 LRU 链表分成了 young 区域和 old 区域，如下图：
![image](https://user-images.githubusercontent.com/24617415/68009674-91675e80-fcbd-11e9-86e3-185a7ca8b842.png)
图中 LRU_old 指向的是 old 区域的第一个位置，是整个链表的 5/8 处。
改进后的 LRU 算法执行流程如下：
1. 图中状态 1 要访问数据页 P3，由于 P3 在 young 区域，因此将其移到链表头部，变成状态 2 
2. 之后要访问一个新的不存在与当前链表的数据页，这时候要淘汰数据页 Pm，但新插入的数据页 Px，是放在 LRU_old 处
3. 处于 old 区域的数据页，每次被访问的时候都要做如下判断：
- 若这个数据页在 LRU 链表中存在的时间超过了 1 秒，就把它移动到链表头部
- 若这个数据页在 LRU 链表中存在的时间短于 1 秒，位置保持不变
1 秒这个时间由参数 innodb_old_blocksZ_time 控制，默认为 1000，单位毫秒




Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

33 | 我查这么多数据，会不会把数据库内存打爆？ #44

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

33 | 我查这么多数据，会不会把数据库内存打爆？ #44

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions