MySQL核心优化，建议收藏

475 05-17

一.数据库服务器配置

CPU：48C
内存：128G
DISK：3.2TSSD

二.CPU的优化

innodb_thread_concurrency=32
表示SQL经过解析后，允许同时有32个线程去innodb引擎取数据，如果超过32个，则需要排队；
值太大会产生热点数据，global锁争用严重，影响性能

三.内存的优化

query_cache_type=0
query_cache_size=0
缓存查询，5.6默认关闭，在应用层实现，比如MC、redis

四.IO的优化

1.innodb_buffer_pool_size=50G
类似SGA，衡量总的IO处理能力上限，一般为物理内存的60%-70%，这里128G部署2个实例，剩下28G分配给OS和mysql连接等使用
2.innodb_io_capacity=20000
每秒后台进程处理IO数据的上限，一般为IO QPS总能力的75%
比如SSD是3W QPS，75%大概是2W，双实例减半，为1W，几个实例除以几
3.innodb_log_files_in_group=4
几个innodb redo log日志组

4.innodb_log_file_size=1000M
redo log日志循化写，生产必须大于1G，
如果太小，那么innodb_buffer_pool_size的数据有可能不能及时写入redo log造成halt等待；查看是否够用？如果value大于0，则提高改参数或者增加日志组

root@master 12:51:  [(none)]> show global status like '%log_wait%';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| Innodb_log_waits | 0     |
+------------------+-------+
1 row in set (0.00 sec)
root@master 12:54:  [(none)]> show global status like '%Innodb_os_log_written%';
+-----------------------+-------+
| Variable_name         | Value |
+-----------------------+-------+
| Innodb_os_log_written | 1024  |
+-----------------------+-------+
1 row in set (0.00 sec)
#此参数大小可作为设置日志文件size大小参考值

5.innodb_flush_method=O_DIRECT
SSD直接写硬盘，不写硬盘cache，也就是绕过fsync()刷硬盘
6.innodb_max_dirty_pages_pct=50
当脏块达到innodb_buffer_pool_size的50%时，触发检查点，写磁盘
7.innodb_file_per_table=on
一表一文件，可以避免共享表空间的IO竞争
8.innodb_page_size=4k
默认是16K，这里是SSD，写SSD前要擦除，擦除单位是extent，一个extent有128个page组成，16_128 > 4_128 ，效率会更高
9innodb_flush_neighbors=0
SSD设置为0，SAS打开刷新相邻块，随机访问转换为顺序访问

五.连接的优化

1.back_log=300
默认是50，TCP/IP的连接数量，一个连接占用256KB内存，最大是64MB，256 * 300 =75MB内存
和三次握手有关系

net.ipv4.tcp_max_sync_backlog= 8192  类似活动场所
sync接收队列的长度，默认是1024，当mysql在很短时间内得到很多的请求，需要增加，太大会消耗资源
太小的话会在show processlist出现未认证错误
net.core.somaxconn=1024   类似活动场所中的座位数
尽可能防止丢包，超过这个值会触发超时或者重传，限制在net.ipv4.ip_local_port_range这个范围之内

syn_queue取64和tcp_max_sync_backlog最大者，默认是1024，当瞬时很多连接进来这个参数会进行限制，否则太大容易消耗资源
accept queue取back_log和somaxconn最小者，用来防止丢包，当瞬时很多连接进来达到上限后，后来连接将超时触发重传机制
当有3000个连接进来，将队列accept queue占满，应用还没来得及将请求从队列中取出，剩下的2700个连接将被拒绝，每取走一个请求（一个连接，mysql一个线程一个连接），将创建一个thread线程
2.max_connections=3000
连接的创建和销毁都需要系统资源，比如内存、文件句柄
业务说的支持多少并发，指的是每秒请求数，也就是QPS
同一时刻并行的SQL由innodb_thread_concurrency决定，最大不能超过该值
如果一个用户的请求数据超过64MB（比如排序），就会申请临时空间，放到硬盘上
如果3000个用户同时连上mysql，最小需要内存3000_256KB=750M，最大需要内存3000_64MB=192G，如果innodb_buffer_pool_size是80GB，可用内存不到48G，192GB>48GB，将会产生SWAP，此时将会影响性能
连接数过高，不一定带来吞吐量的提高，而且可能占用更多的系统资源
一个DB 3W QPS计算，前端有100个web服务器，每个web服务器需要300个QPS，每个QPS占用时间=网络来回时间+SQL执行时间，以20ms计算，需要6个连接数（300/1000/20ms=6）
示例1：有100台web服务器，PHP/JAVA的最大连接数可设置为：3000/100=30
示例2：有30台web服务器，要扩容到60台，web服务器连接数怎么配置？web服务器最大连接数：之前是3000/30=100，现在3000/60=50即可
3.max_user_connections=2980
剩余连接数用作管理

4.table_open_cache=1024
打开表的缓存，跟表数量没关系
1000个连接上来，都需要访问A表，那么会打开1000个表，打开1000个表是指mysql创建1000个这个表的对象，连接直接访问表对象，类似会把这张表做一个class，1000个连接都访问这个表对象，当表对象没了，重新new一个，不需要每次都打开物理表

root@master 14:44:  [(none)]> show variables like '%table_open_cache';
+------------------+-------+
| Variable_name    | Value |
+------------------+-------+
| table_open_cache | 1024  |
+------------------+-------+
1 row in set (0.00 sec)
root@master 14:46:  [(none)]> show global status like 'open%tables%'; 
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| Open_tables   | 19    |
| Opened_tables | 113   |
+---------------+-------+
2 rows in set (0.00 sec)

可以考虑设置为max_connections或者max_connections*查询同时用到的表个数或者

5.thread_cache_size=512
都是短连接进来容易产生短连接风暴
会话层：事务状态、认证会话
连接层：网络连接、包传输
一个用户对应一个session 对应一个connection
connection - thread:操作系统调用
3000个用户进来使用cache的512个线程，用完就放回去，避免创建、销毁线程的开销
6.wait_timeout=120
指的是app应用连接mysql进行操作完毕后，空闲120秒后断开
7.interactive_timeout=120
指的是mysql client连接mysql进行操作完毕后，空闲120秒后断开

六.数据一致性的优化

1.innodb_flush_log_at_trx_commit=1
0，不管有没有提交，每秒钟都写到binlog日志里
1，每次提交事务，都会把log buffer的内容写到磁盘里去，对日志文件做到磁盘刷新，安全最好
2，每次提交事务，都写到操作系统缓存，由OS刷新到磁盘，性能最好
2.sync_binlog=1
0，事务提交后，mysql不做fsync之类的刷盘，由文件系统来决定什么落盘
n，多少次提交，每n次提交持久化磁盘
生产设为1
3.日志写盘过程

1)三个update会话，三个线程都会产生的操作日志
2 )commit后提交到公共的cache中，三个进程之间不能相互看到对方的操作内容
3)经过write写入到标准I/O cache中，也就是文件系统句柄，线程缓存
4)如果需要让其他线程看到文件句柄内容，就需要通过flush刷新到全局可见文件系统缓存
5)最后最重的一步是将内存数据sync落盘