MySQL主从复制的常见拓扑原理分析以及如何提高主从复制的效率总结综述.docx
- 文档编号:10649662
- 上传时间:2023-02-22
- 格式:DOCX
- 页数:21
- 大小:177.52KB
MySQL主从复制的常见拓扑原理分析以及如何提高主从复制的效率总结综述.docx
《MySQL主从复制的常见拓扑原理分析以及如何提高主从复制的效率总结综述.docx》由会员分享,可在线阅读,更多相关《MySQL主从复制的常见拓扑原理分析以及如何提高主从复制的效率总结综述.docx(21页珍藏版)》请在冰豆网上搜索。
MySQL主从复制的常见拓扑原理分析以及如何提高主从复制的效率总结综述
MySQL主从复制的常见拓扑、原理分析以及如何提高主从复制的效率总结
一、主从复制搭建方法参考
1、MySQL5.6数据库主从(Master/Slave)同步安装与配置详解请参考:
2、使用mysqlreplicate命令快速搭建Mysql主从复制:
二、Mysql主从复制的常用拓扑结构
2.1、一主一从
这里写图片描述
是最基础的复制结构,用来分担之前单台数据库服务器的压力,可以进行读写分离。
2.2、一主多从
一台Slave承受不住读请求压力时,可以添加多台,进行负载均衡,分散读压力。
还可以对多台Slave进行分工,服务于不同的系统,例如一部分Slave负责网站前台的读请求,另一部分Slave负责后台统计系统的请求。
因为不同系统的查询需求不同,对Slave分工后,可以创建不同的索引,使其更好的服务于目标系统。
2.3、双主复制
Master存在下线的可能,例如故障或者维护,需要把Slave切换为Master。
在原来的Master恢复可用后,由于其数据已经不是最新的了,不能再做主,需要做为Slave添加进来。
那么就需要对其重新搭建复制环境,需要耗费一定的工作量。
双主结构就是用来解决这个问题的,互相将对方作为自己的Master,自己作为对方的Slave来进行复制,但对外来讲,还是一个主和一个从。
当主Master下线时,备Master切换为主Master,当原来的主Master上线后,因为他记录了自己当前复制到对方的什么位置了,就会自动从之前的位置开始重新复制,不需要人为地干预,大大提升了效率。
2.4、级联复制
当直接从属于Master的Slave过多时,连到Master的SlaveIO线程就比较多,对Master的压力是很大的。
级联结构就是通过减少直接从属于Master的Slave数量,减轻Master的压力,分散复制请求,从而提高整体的复制效率。
2.5、双主级联
级联复制结构解决了Slave过多导致的瓶颈问题,但还是有单主结构中切换主时的维护问题。
那么为了解决这个问题,就可以加入上面的双主结构。
在必要时,可以再对Slaves进行分级。
Mysql的复制结构有很多种方式,复制的最大问题是数据延时,选择复制结构时需要根据自己的具体情况,并评估好目标结构的延时对系统的影响。
三、Mysql主从复制过程及原理
3.1、BinaryLog简单介绍
因为Binlogdump线程操作的文件是bin-log日志文件,并且实现主从复制在主服务器上主要依靠bin-log日志文件,所以我们简单介绍一下bin-log日志文件。
3.2、原理
MySQL的Replication(英文为复制)是一个多MySQL数据库做主从同步的方案,特点是异步复制,广泛用在各种对MySQL有更高性能、更高可靠性要求的场合。
与之对应的是另一个同步技术是MySQLCluster,但因为MySQLCluster配置比较复杂,所以使用者较少。
MySQLReplication就是从服务器拉取主服务器上的二进制日志文件,然后再将日志文件解析成相应的SQL语句在从服务器上重新执行一遍主服务器的操作,通过这种方式来保证数据的一致性。
MySQL的Replication是一个异步复制的过程(mysql5.1.7以上版本分为异步复制和半同步两种模式),它是从一个Mysqlinstance(instance英文为实例)(我们称之为Master)复制到另一个Mysqlinstance(我们称之slave)。
3.3、三个线程
在master与slave之间实现整个复制过程主要由三个线程来完成:
1、SlaveSQLthread线程,在slave端
2、SlaveI/Othread线程,在slave端
3、Binlogdumpthread线程(也可称为IO线程),在master端
1
2
3
注意:
如果一台主服务器配两台从服务器那主服务器上就会有两个Binlogdump线程,而每个从服务器上各自有两个线程。
要实现MySQL的Replication,首先必须打开master端的binlog(mysql-bin.xxxxxx)日志功能,否则无法实现mysql的主从复制。
因为mysql的整个主从复制过程实际上就是:
slave端从master端获取binlog日志,然后再在自己身上完全顺序的执行该日志中所记录的各种SQL操作。
有关具体如何开启mysql的binlog日志功能,请大家自己在网上搜。
3.4、主从复制流程
MySQL主从复制的基本交互过程,如下:
1、slave端的IO线程连接上master端,并请求从指定binlog日志文件的指定pos节点位置(或者从最开始的日志)开始复制之后的日志内容。
2、master端在接收到来自slave端的IO线程请求后,通知负责复制进程的IO线程,根据slave端IO线程的请求信息,读取指定binlog日志指定pos节点位置之后的日志信息,然后返回给slave端的IO线程。
该返回信息中除了binlog日志所包含的信息之外,还包括本次返回的信息在master端的binlog文件名以及在该binlog日志中的pos节点位置。
3、slave端的IO线程在接收到master端IO返回的信息后,将接收到的binlog日志内容依次写入到slave端的relaylog文件(mysql-relay-bin.xxxxxx)的最末端,并将读取到的master端的binlog文件名和pos节点位置记录到master-info(该文件存slave端)文件中,以便在下一次读取的时候能够清楚的告诉master“我需要从哪个binlog文件的哪个pos节点位置开始,请把此节点以后的日志内容发给我”。
4、slave端的SQL线程在检测到relaylog文件中新增内容后,会马上解析该log文件中的内容。
然后还原成在master端真实执行的那些SQL语句,并在自身按顺丰依次执行这些SQL语句。
这样,实际上就是在master端和slave端执行了同样的SQL语句,所以master端和slave端的数据完全一样的。
以上mysql主从复制交互过程比较拗口,理解起来也比较麻烦,我简化了该交互过程。
如下:
1、master在执行sql之后,记录二进制log文件(bin-log)。
2、slave连接master,并从master获取binlog,存于本地relay-log中,然后从上次记住的位置起执行SQL语句,一旦遇到错误则停止同步。
从以上mysql的Replication原理可以看出:
主从间的数据库不是实时同步,就算网络连接正常,也存在瞬间主从数据不一致的情况。
如果主从的网络断开,则从库会在网络恢复正常后,批量进行同步。
如果对从库进行修改数据,那么如果此时从库正在在执行主库的bin-log时,则会出现错误而停止同步,这个是很危险的操作。
所以一般情况下,我们要非常小心的修改从库上的数据。
一个衍生的配置是双主、互为主从配置,只要双方的修改不冲突,则可以工作良好。
如果需要多主库的话,可以用环形配置,这样任意一个节点的修改都可以同步到所有节点。
3.5、整体过程就是:
MySQL复制基于主服务器在二进制日志中跟踪所有对数据库的更改(更新、删除等等)。
每个从服务器从主服务器接收主服务器已经记录到其二进制日志的保存的更新,以便从服务器可以对其数据拷贝执行相同的更新。
将主服务器的数据拷贝到从服务器的一个途径是使用LOADDATAFROMMASTER语句。
请注意LOADDATAFROMMASTER目前只在所有表使用MyISAM存储引擎的主服务器上工作。
并且,该语句将获得全局读锁定。
MySQL使用3个线程来执行复制功能,其中1个在主服务器上,另两个在从服务器上。
当发出STARTSLAVE时,从服务器创建一个I/O线程,以连接主服务器并让它发送记录在其二进制日志中的语句。
主服务器创建一个线程,即I/O线程,将二进制日志中的内容发送到从服务器。
该线程可以识别为主服务器上SHOWPROCESSLIST的输出中的BinlogDump线程。
从服务器I/O线程读取主服务器BinlogDump线程发送的内容并将该数据拷贝到从服务器数据目录中的本地文件中,即中继日志。
第3个线程是SQL线程,是从服务器创建用于读取中继日志并执行日志中包含的更新。
有多个从服务器的主服务器创建为每个当前连接的从服务器创建一个线程;每个从服务器有自己的I/O和SQL线程。
四、MySQL支持的复制类型及其优缺点
bin-log日志文件有两种格式,一种是Statement-Based,另一种是Row-Based。
(1):
基于语句的复制(Statement-Based):
在主服务器上执行的SQL语句,在从服务器上执行同样的语句。
MySQL默认采用基于语句的复制,效率比较高。
一旦发现没法精确复制时,会自动选着基于行的复制。
(2):
基于行的复制(Row-Based):
把改变的内容复制过去,而不是把命令在从服务器上执行一遍.从mysql5.0开始支持
(3):
混合类型的复制:
默认采用基于语句的复制,一旦发现基于语句的无法精确的复制时,就会采用基于行的复制。
4.1、Statement-Based优点和缺点分析
优点
bin-log日志包含了描述数据库操作的事件,但是这些事件包含的情况只是对数据库进行改变的操作,例如insert、update、create、delete等操作。
相反对于select、desc等类似的操作并不会去记录,并且它记录的是语句,所以相对于Row-Based来说这样会占用更少的存储空间。
因为bin-log日志文件记录了所有的改变数据库的语句,所以此文件可以作为以后的数据库的审核依据
缺点
不安全,并不是所有的改变数据的语句都会被记录复制。
任何的非确定性的行为都是很难被记录复制的。
例如:
对于delete或者update语句,如果使用了limit但是并没有orderby,这就属于非确定性的语句,就不会被记录
对于没有索引条件的update语句,必须锁定更多的数据,降低了数据库的性能。
insert……select语句同样也需要锁定大量的数据,对数据库的性能有所损耗。
获取更详细的信息可以参考官方文档——Statement-Based的优点和缺点
4.2、Row-Based优点和缺点分析
优点
所有的改变都会被复制,这是最安全的复制方式
对于update、insert……select等语句锁定更少的行
此种方式和大多数的数据库系统一样,所以了解其他的系统的人员可以很容易的转到mysql
缺点
使用不方便,我们不能通过bin-log日志文件查看什么语句执行了,也无从知道在从服务器上接收到什么语句,我们只能看到什么数据改变了
因为记录的是数据,所以说bin-log日志文件占用的存储空间要比Statement-based大。
对于数据量大的操作其花费的时间有更长
获取更详细的信息可以参考官方文档——Row-Based的优点和缺点
bin-log日志文件默认的格式为Statement-Based,如果想改变其格式在开启服务的时候使用—binlog-format选项,其具体命令如下
mysqld_safe–user=msyql–binlog-format=格式&
1
四、主服务器流程分析
4.1、主服务器线程Binlogdumpthread
Binlogdump线程是当有从服务器连接的时候由主服务器创建,其大致工作过程经历如下几个阶段:
首先bin-log日志文件加锁,然后读取更新的操作,读取完毕以后将锁释放掉,最后将读取的记录发送给从服务器。
我们可以使用如下的命令来查看该线程的信息
mysql>SHOWPROCESSLIST\G
1
以我的系统为例,因为我这系统中是一台主服务器和两台从服务器,所以会列出两条Binlogdump线程的信息
***************************1.row***************************
Id:
2
User:
repuser
Host:
192.168.144.131:
41544
db:
NULL
Command:
BinlogDump
Time:
54
State:
Masterhassentallbinlogtoslave;waitingforbinlogtobeupdated
Info:
NULL
***************************2.row***************************
Id:
3
User:
repuser
Host:
192.168.144.132:
40888
db:
NULL
Command:
BinlogDump
Time:
31
State:
Masterhassentallbinlogtoslave;waitingforbinlogtobeupdated
Info:
NULL
上述字段中的state字段会有以下几种状态:
1.Sendingbinlogeventtoslave
表示Binlogdump线程已经读取完binlog日志中更新的event,现在正在发送给从服务器
2.Finishedreadingonebinlog;switchingtonextbinlog
表示Binlogdump线程已经读取完一个binlog日志,现在正在打开下一个binlog日志读取来发送给从服务器
3.Masterhassentallbinlogtoslave;waitingforbinlogtobeupdated
这就是上面我们看到的state的值,表示Binlogdump线程已经读取完所有的binlog日志文件,并且将其发送给了从服务器。
现在处于空闲状态,正在等待读取有新的操作的binlog日志文件
4.Waitingtofinalizetermination
这个状态持续的很短暂,我们几乎看不到。
当线程停止的时候显示此状态
上述几个状态就是一次主从复制过程中Binlogdump线程所经历的状态,如果我们是在测试的环境中,上述1、2、4状态我们几乎是看不到的,因为它执行的很快。
在主从系统中主服务器上的一个主要的文件就是bin-log日志,该线程操作的文件也是此日志文件,因此这是我们需要在配置文件f中打开bin-log日志的原因,使用此文件来记录我们的更新操作。
[mysqld]
log-bin=mysql-bin
server-id=1
1
2
3
还有一点需要注意,在上面已经说过,但是在这里觉得有必要再重复一遍,就是有多少个从服务器连接主服务器上就有多少个Binlogdump线程。
bin-log日志文件管理
对于bin-log日志文件,其默认的名称为mysql-bin.xxxxxx。
而且还有一个索引文件mysql-bin.index,其中记录了当前所有的bin-log日志文件。
对于新的主服务器只有一个bin-log日志文件mysql-bin.000001。
此时所有的操作都有这个文件来记录,如果我们想更换bin-log日志文件,可以使用如下命令
Mysql>flushlogs;
1
2
此时会创建一个mysql-bin.000002文件来记录以后的操作。
除了使用上述命令以外,当bin-log日志文件达到其最大值的时候也会产生新的bin-log日志文件
其文件最大值和文件名包括索引文件的名称可以使用–max_binlog_size、–log-bin和—log-bin-index选项来改变,具体命令如下
mysqld_safe–user=msyql–max_binlog_size=文件长度–log-bin=新的日志文件名称–log-bin-index=新索引文件名&
1
对于主服务器来说,总起来一句话:
主服务器针对于每一个从服务器都创建一个Binlogdump线程,用来读取bin-log日志中更新的操作将其发送给从服务器,发送完毕以后继续等待bin-log日志是否有更新。
五、从服务器流程分析
在主服务器探究这篇文章中我们提到过,在一次主从复制过程中需要用到三个线程:
Binlogdump线程、SlaveI/O线程和SlaveSQL线程,其中Binlogdump线程在主服务器上面,剩下的两个线程是在从服务器上面工作的。
这两个线程在从服务器上面的工作流程如下图所示:
对于这两个线程随着从服务器开启slave而产生
mysql>STARTSLVAE;
然后使用
Mysql>SHOWSLAVESTATUS\G
1
查看这两个线程情况
……
Master_Log_File:
mysql-bin.000003
Read_Master_Log_Pos:
1264
Relay_Log_File:
localhost-relay-bin.000002
Relay_Log_Pos:
878
Relay_Master_Log_File:
mysql-bin.000003
Slave_IO_Running:
Yes
Slave_SQL_Running:
Yes
……
上面结果中的Slave_IO_Running:
Yes和Slave_SQL_Running:
Yes表示这两个线程正在运行。
然后我们在从服务器上面使用命令
mysql>SHOWPROCESSLIAT\G
1
显示如下结果(记为结果一)
***************************1.row***************************
Id:
22
User:
systemuser
Host:
db:
NULL
Command:
Connect
Time:
4
State:
Waitingformastertosendevent
Info:
NULL
***************************2.row***************************
Id:
23
User:
systemuser
Host:
db:
NULL
Command:
Connect
Time:
4
State:
Slavehasreadallrelaylog;waitingfortheslaveI/Othreadtoupdateit
Info:
NULL
从State信息可以看出Id22是I/O线程,正在等待主服务器发送更新的内容;Id23是SlaveSQL线程,已经读取了relaylog文件中所有更新的内容,正在等待I/O线程更新该文件。
使用命令停止slave机制
mysql>STOPSLVAE;
1
然后我们再次查看会发现结果如下
……
Master_Log_File:
mysql-bin.000003
Read_Master_Log_Pos:
1264
Relay_Log_File:
localhost-relay-bin.000002
Relay_Log_Pos:
878
Relay_Master_Log_File:
mysql-bin.000003
Slave_IO_Running:
No
Slave_SQL_Running:
No
……
说明这两个线程已经停止了运行。
此时再次使用SHOWPROCESSLIST\G命令,则没有结果显示
5.1、SlaveI/O线程
SlaveI/O线程去连接主服务器的Binlogdump线程并要求其发送binlog日志中记录的更新的操作,然后它将Binlogdump线程发送的数据拷贝到从服务器上(也就是本地)的文件relaylog中。
当然要查看此线程是否运行,除了上面介绍的方法,还可以使用
mysql>SHOWSLAVELIKE‘Slave_running’;
1
这时如果出现下面的结果说明该线程正在运行
+-----------------+-------------------+
|Variable_name|Value|
+-----------------+-------------------+
|Slave_running|ON|
+-----------------+-------------------+
在上述结果一中我们可以看到1.row即是SlaveI/O线程的信息,其State:
Waitingformastertosendevent表示正在等待主服务器发送内容。
当然State不止这一个值,它还有其它的值,下面列出了State的所有的值
1.Waitingformasterupdate
在连接到主服务器之前的初始状态
2.Connectingtomaster
该线程正在连接主服务器,当然如果我们的网络环境优异的话,此状态我们几乎是看不到的
3.Checkingmasterversion
这个状态发生的时间也非常短暂,该状态在该线程和主服务器建立连接之后发生。
4.Registeringslaveonmaster
在主服务器上面注册从服务器,每当有新的从服务器连接进来以后都要在主服务器上面进行注册
5.Requestingbinlogdump
向主服务器请求binlog日志的拷贝
6.Waitingtonnectafterafailedbinlogdumprequest
如果5中失败,则该线程进入睡眠状态,此时State就是这个值,等待着去定期重新连接主服务器,那这个周期的大小可以通过CHANGEMASTERTO来指定
7.Reconnectingafterafailedbinlogdumprequest
去重新连接主服务器
8.Waitingformastertosendevent
此值就是我们上述结果所显示的,正常情况下我们查看的时候一般都是这个值。
其具体表示是这个线程已经和主服务器建立了连接,正在等待主服务器上的binlog有更新,如果主服务器的Binlogdump线程一直是空闲的状态的话,那此线程会等待很长一段时间。
当然也不是一直等待下去,如果时间达到了slave_net_timeout规定的时间,会发生等待超时的情况,在这种情况下I/O线程会重新去连接主服务器
9.Queueingmastereventtotherelaylog
该线程已经读取了Binlogdump
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MySQL 主从 复制 常见 拓扑 原理 分析 以及 如何 提高 效率 总结 综述