Galera是一个MySQL(也支持MariaDB,Percona)的同步多主集群软件,目前只支持InnoDB引擎。
主要功能:
- 同步复制
- 真正的multi-master,即所有节点可以同时读写数据库
- 自动的节点成员控制,失效节点自动被清除
- 新节点加入数据自动复制
- 真正的并行复制,行级
- 用户可以直接连接集群,使用感受上与MySQL完全一致
优势:
因为是多主,所以不存在Slave lag(延迟)
不存在丢失交易的情况
同时具有读和写的扩展能力
更小的客户端延迟
节点间数据是同步的,而Master/Slave模式是异步的,不同slave上的binlog可能是不同的
技术:
Galera集群的复制功能基于Galera library实现,为了让MySQL与Galera library通讯,特别针对MySQL开发了wsrep API。
MariaDB介绍
MariaDB是MySQL的一个分支,由MySQL的创始人Michael Widenius主导开发,采用GPL授权许可。
开发这个分支的原因之一是Oracle公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险。
MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。
在存储引擎方面,使用XtraDB来代替MySQL的InnoDB。
方案总览
- haproxy作为MariaDB Galera Cluster的前端
- 2台haproxy用keepalived避免单点故障
- 3台MariaDB和一个garbd仲裁节点组成集群,仲裁节点上无数据
- Galera的SST采用Percona提供的XtraBackup(防止锁表,非阻塞)
环境描述
OS: CentOS 6.0 64bit
MariaDB server1: | 192.168.0.171 |
MariaDB server2: | 192.168.0.172 |
MariaDB server3: | 192.168.0.173 |
HAProxy server1: | 192.168.0.151 |
HAProxy server2: | 192.168.0.152 |
HAProxy共享的VIP: | 192.168.0.170 |
MySQL root password: | q1w2e3!@# |
Cluster root username: | clusteroot |
Cluster root password: | q1w2e3!@# |
Galera SST user: | sst |
Galera SST password: | sstpass123 |
环境准备
以下操作以MariaDB server1为示例。
1.准备hosts文件
编辑上述每台服务器的/etc/hosts,添加如下内容:
192.168.0.151 haproxy1.cluster.local haproxy1 192.168.0.152 haproxy2.cluster.local haproxy2 192.168.0.171 galera1.cluster.local galera1 192.168.0.172 galera2.cluster.local galera2 127.0.0.1 ::1 |
2.安装163,epel,Percona,MariaDB的YUM源
[root@mdb-01 ~]# wget http://mirrors.163.com/.help/CentOS6-Base-163.repo
[root@mdb-01 ~]# rpm -ivh http://dl./pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
[root@mdb-01 ~]# cat CentOS6-Base-163.repo > /etc/yum.repos.d/CentOS-Base.repo
[root@mdb-01 ~]# vi /etc/yum.repos.d/MariaDB.repo
# MariaDB 5.5 CentOS repository list - created 2013-05-16 01:58 UTC # http:///mariadb/repositories/ [mariadb] name = MariaDB baseurl = http://yum./5.5/centos6-amd64 gpgkey=https://yum./RPM-GPG-KEY-MariaDB gpgcheck=1 |
[root@mdb-01 ~]# rpm --import https://yum./RPM-GPG-KEY-MariaDB
[root@mdb-01 ~]# vi /etc/yum.repos.d/Percona.repo
[percona] name = CentOS $releasever - Percona baseurl=http://repo./centos/$releasever/os/$basearch/ enabled = 1 gpgkey = file:///etc/pki/rpm-gpg/RPM-GPG-KEY-percona gpgcheck = 1 |
[root@mdb-01 ~]# wget -O /etc/pki/rpm-gpg/RPM-GPG-KEY-perconahttp://www./downloads/RPM-GPG-KEY-percona
[root@mdb-01 ~]# yum makecache
Galera Cluster的配置
1.安装MariaDB、galera、xtrabackup
[root@mdb-01 ~]#
[root@mdb-01 ~]#
2.设置开机启动MariaDB
[root@mdb-01 ~]#
[root@mdb-01 ~]#
3.设置MariaDB的root密码,并做安全加固
[root@mdb-01 ~]#
4.确认MariaDB已正确安装并处于运行状态
[root@mdb-01 ~]#
Enter password:
Welcome to the MariaDB monitor.
Your MariaDB connection id is 11
Server version: 5.5.29-MariaDB MariaDB Server, wsrep_23.7.3.rXXXX
Copyright (c) 2000, 2013, Oracle, Monty Program Ab and others.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
MariaDB [(none)]>
注意查看是否有"wsrep_23.7.3.rXXXX"的输出。
5.创建用于同步数据库的SST账号
[root@mdb-01 ~]#
mysql> GRANT USAGE ON *.* to sst@'%' IDENTIFIED BY 'sstpass123';
mysql> GRANT ALL PRIVILEGES on *.* to sst@'%';
mysql> FLUSH PRIVILEGES;
mysql> quit
6.创建wsrep.cnf文件
[root@mdb-01 ~]#
[root@mdb-01 ~]#
只需要修改如下4行:
wsrep_provider=/usr/lib64/galera/libgalera_smm.so
wsrep_cluster_address="gcomm://"
wsrep_sst_auth=sst:sstpass123
wsrep_sst_method=xtrabackup
注意:
"gcomm://" 是特殊的地址,仅仅是Galera cluster初始化启动时候使用。
如果集群启动以后,我们关闭了第一个节点,那么再次启动的时候必须先修改
"gcomm://"为其他节点的集群地址,例如
wsrep_cluster_address="gcomm://192.168.0.172:4567"
7.在/etc/my.cnf中加入如下一行
!includedir /etc/my.cnf.d/
8.确认本机防火墙上开放了所需TCP 3306和TCP 4567的端口
[root@mdb-01 ~]#
[root@mdb-01 ~]#
9.重起MariaDB服务
[root@mdb-01 ~]#
10.确认MySQL的3306端口和wsrep的4567端口处于监听状态
[root@mdb-01 ~]#
tcp
tcp
至此,集群的第一个节点配置完毕。
11.为集群增加其他节点
在Galera Cluster中,新接入的节点叫Joiner,给joiner提供复制的节点叫Donor。
对于生产环境使用,建议设立一个专用的"参考节点",这个"参考节点"不执行任何客户端的SQL请求。
上图中红色的NODE A即为"参考节点",这样做的好处有如下几条:
1.数据一致性:
因为"参考节点"本身不执行任何客户端SQL,所以在这个节点上发生transaction冲突的可能性最小。
因此如果发现集群有数据不一致的时候,"参考节点"上的数据应该是集群中最准确的。
2.数据安全性:
因为"参考节点"本身不执行任何客户端SQL,所以在这个节点上发生灾难事件的可能性最小。
因此当整个集群宕掉的时候,"参考节点"应该是恢复集群的最佳节点。
3.高可用
"参考节点"可以作为专门state snapshot donor。
因为"参考节点"不服务于客户端,因此当使用此节点进行SST的时候,不会影响用户体验,并且前端的负载均衡设备也不需要重新配置。
构造如上图的结构,新节点的操作步骤如下:
1.按照上述1-9的步骤安装MariaDB和Galera library
2.除了第5步wsrep_cluster_address的配置稍有不同:
wsrep_cluster_address="gcomm://Node-A-IP:4567"
3.重起MariaDB
4.按上述步骤配置下一个节点,将其wsrep_cluster_address指向其前一个节点,例如:
Node C -> Node B, Node D -> Node C, … , Node N -> …
5.配置Node A重新加入集群,修改/etc/my.cnf.d/wsrep.cnf中的wsrep_cluster_address地址指向Node N。
wsrep_cluster_address="gcomm://Node-N-IP:4567"
修改节点的wsrep_cluster_address有两种方式:
1)修改配置文件中的wsrep_cluster_address,然后重启MySQL
2)直接修改MySQL全局变量
mysql> SHOW VARIABLES LIKE 'wsrep_cluster_address'; +-----------------------+----------------------------+ | Variable_name +-----------------------+----------------------------+ | wsrep_cluster_address | gcomm://192.168.0.172:4567 | +-----------------------+----------------------------+ 1 row in set (0.00 sec) mysql> set global wsrep_cluster_address="gcomm://192.168.0.172:4567,192.168.0.173:4567"; Query OK, 0 rows affected (2.20 sec) mysql> SHOW VARIABLES LIKE 'wsrep_cluster_address'; +-----------------------+-------------------------------------------------------+ | Variable_name +-----------------------+-------------------------------------------------------+ | wsrep_cluster_address | gcomm://192.168.0.172:4567,192.168.0.173:4567 +-----------------------+-------------------------------------------------------+ 1 row in set (0.00 sec) |
12.确认galera集群正确安装和运行
[root@mdb-01 ~]#
wsrep_ready 为ON,则说明MariaDB Galera集群已经正确运行了。
wsrep_cluster_size 标明了组成集群的节点个数。
13.给集群加入Galera arbitrator
对于只有2个节点的Galera Cluster和其他集群软件一样,需要面对极端情况下的"脑裂"状态。
为了避免这种问题,Galera引入了"arbitrator(仲裁人)"。
"仲裁人"节点上没有数据,它在集群中的作用就是在集群发生分裂时进行仲裁,集群中可以有多个"仲裁人"节点。
"仲裁人"节点加入集群的方法很简单,运行如下命令即可:
[root@arbt ~]# garbd -a gcomm://192.168.0.171:4567 -g my_wsrep_cluster -d
参数说明:
-d 以daemon模式运行
-a 集群地址
-g 集群名称
Haproxy的相关配置
1.创建用于后端MySQL服务器健康检查的数据库账号
haproxy现在支持option mysql-check,这个检查会向后端服务器发送2个包,一个用于客户端认证,一个用于关闭连接。这个检查需要在每个节点上都需要创建一个无密码的MySQL账号。
[root@mdb-01 ~]#
Enter password:
mysql> INSERT INTO mysql.user (host,user) values ('%','haproxy');
mysql> FLUSH PRIVILEGES;
mysql> quit
2.编译haproxy和keepalived(过程略,可参考我这篇博文:http://blog.sina.com.cn/s/blog_704836f40101gm11.html)
3.配置keepalived(此处只列出Master的配置)
vrrp_script chk_haproxy { |
4.配置haproxy
defaults |
其他相关
1.Galera Cluster部署的前置检查
在要转成Galera Cluster的数据库上执行如下SQL语句:
SELECT DISTINCT |
2.MySQL Galera监控
监控状态参数说明:
参考文档:
MariaDB和Galera Cluster相关文档
http://blog./2011/07/install-mysql-replication-and-cluster-using-galera/
http://weetinyworld./2013/04/setting-up-mariadb-galera-cluster-from.html
http://blog./2013/03/galera-cluster-for-mysql-multi-master-replication/
http://www./blog/2012/08/29/setup-galera-with-sst-xtrabackup-method/
http://blog./2011/07/install-mysql-replication-and-cluster-using-galera/
http://blog./2012/02/high-availability-mysql-cluster-galera-haproxy/
http://www./resources/clustercontrol-mysql-haproxy-load-balancing-tutorial
http:///2012/12/mysql-multi-master-replication-with-galera/
http://www./open-source-cookbook/data-storage/replace-mysql-mysql-galera
http://www./blog/2012/04/08/mysql-galera-cluster-with-haproxy/
http://www./?cat=130
http:///blog/galera-predeployment-check
http://www./files/presentations/percona-live/nyc-2012/PLNY12-galera-cluster-best-practices.pdf
https://groups.google.com/forum/#!msg/codership-team/OUxATjcznPI/H8ftsjZwptAJ
http://www./?p=5844
http:///2008/09/05/mysql-slave-lag-delay-explained-and-7-ways-to-battle-it/
http://wiki./vps-net-features/cloud-servers/template-information/galeramysql-recommended-cluster-configuration/
http://haproxy./download/1.4/doc/configuration.txt
GTID和mysqlfailover相关文档
http://scriptingmysql./2012/12/06/using-the-mysql-script-mysqlfailover-for-automatic-failover-with-mysql-5-6-gtid-replication/
http://svenmysql./2012/10/failover-and-flexible-replication.html
http://svenmysql./2012/10/advanced-use-of-global-transaction.html
http://svenmysql./2013/03/flexible-fail-over-policies-using-mysql.html
http://www./sites/default/files/presentations/MHA_Toronto_Presentation.pdf
http:///?p=78
http://dev./doc/refman/5.6/en/replication-gtids-howto.html
http:///2011/04/05/59
http://www.cnblogs.com/hustcat/archive/2009/12/19/1627525.html
http://dev./doc/refman/5.5/en/replication-howto-masterstatus.html