MySQL关于分库分表及其平滑扩容方案实例讲解

来自：mjsws > 馆藏分类

配色：

字号：大中小

2018-09-24 | 阅：转： | 分享

MySQL关于分库分表及其平滑扩容方案实例讲解众所周知，数据库很容易成为应用系统的瓶颈。单机数据库的资源和处理能力有限，在高并发的分布式系统
中，可采用分库分表突破单机局限。本文总结了分库分表的相关概念、全局ID的生成策略、分片策略、平滑扩容方案、以及流行的方案。1分库
分表概述在业务量不大时，单库单表即可支撑。当数据量过大存储不下、或者并发量过大负荷不起时，就要考虑分库分表。1.1分库分表相关术
语读写分离:不同的数据库，同步相同的数据，分别只负责数据的读和写；分区:指定分区列表达式，把记录拆分到不同的区域中(必须是同
一服务器，可以是不同硬盘)，应用看来还是同一张表，没有变化；分库：一个系统的多张数据表，存储到多个数据库实例中；分表:对于一
张多行(记录)多列(字段)的二维数据表，又分两种情形：(1)垂直分表:竖向切分，不同分表存储不同的字段，可以把不常用或者大容量
、或者不同业务的字段拆分出去；(2)水平分表(最复杂):横向切分，按照特定分片算法，不同分表存储不同的记录。1.2真的要采用
分库分表？需要注意的是，分库分表会为数据库维护和业务逻辑带来一系列复杂性和性能损耗，除非预估的业务量大到万不得已，切莫过度设计、过
早优化。规划期内的数据量和性能问题，尝试能否用下列方式解决：-当前数据量：如果没有达到几百万，通常无需分库分表；-数据量问题：
增加磁盘、增加分库(不同的业务功能表，整表拆分至不同的数据库)；-性能问题：升级CPU/内存、读写分离、优化数据库系统配置、优化
数据表/索引、优化SQL、分区、数据表的垂直切分；-如果仍未能奏效，才考虑最复杂的方案：数据表的水平切分。2全局ID生成策略
2.1自动增长列优点：数据库自带功能，有序，性能佳。638棋牌http://www.rodlg.com缺点：单库单表无妨，分库分
表时如果没有规划，ID可能重复。解决方案：2.1.1设置自增偏移和步长?1?##假设总共有10个分表##级别可选:SE
SSION(会话级),GLOBAL(全局)SET@@SESSION.auto_increment_offset=1;##
起始值,分别取值为1~10SET@@SESSION.auto_increment_increment=10;##步
长增量如果采用该方案，在扩容时需要迁移已有数据至新的所属分片。2.1.2全局ID映射表在全局Redis中为每张数据表创建一个
ID的键，记录该表当前最大ID；每次申请ID时，都自增1并返回给应用；Redis要定期持久至全局数据库。2.2U
UID(128位)在一台机器上生成的数字，它保证对在同一时空中的所有机器都是唯一的。通常平台会提供生成UUID的API。UUID
由4个连字号(-)将32个字节长的字符串分隔后生成的字符串，总共36个字节长。形如：550e8400-e29b-41d4-a716
-446655440000。UUID的计算因子包括：以太网卡地址、纳秒级时间、芯片ID码和许多可能的数字。UUID是个标准，其
实现有几种，最常用的是微软的GUID(GlobalsUniqueIdentifiers)。优点：简单，全球唯一；缺点：存储和
传输空间大，无序，性能欠佳。2.3COMB(组合)组合GUID(10字节)和时间(6字节)，达到有序的效果，提高索引性能。2
.4Snowflake(雪花)算法Snowflake是Twitter开源的分布式ID生成算法，其结果为long(6
4bit)的数值。其特性是各节点无需协调、按时间大致有序、且整个集群各节点单不重复。该数值的默认组成如下(符号位之外的三部分允许
个性化调整)：-1bit:符号位，总是0(为了保证数值是正数)。<喎?"/kf/ware/vc/"target="_bla
nk"class="keylink">vcD4NCjxwPi0gNDFiaXQ6ILrBw+vK/Si/ydPDIDY5IMTq
KaO7PC9wPg0KPHA+LSAxMGJpdDogvdq140lEKDViaXTK/b7d1tDQxCArIDViaXS92
rXjSUSjrNans9YgMzIgKiAzMiA9IDEwMjQguPa92rXjKTwvcD4NCjxwPi0gMTJiaX
Q6IMH3y666xSjDv7j2vdq148O/usHD68Ta1qez1iA0MDk2ILj2IElEo6zP4LWx09o
gNDA5zfK1xCBRUFOjrM/gzazKsbzkxNrI5yBJRCDT9ret16qjrNTytci0/dbBz8LS
u7rBw+spPC9wPg0KPGgyIGlkPQ=="3-分片策略">3分片策略3.1连续分片根据特定字段(比如用户ID、
订单时间)的范围，值在该区间的，划分到特定节点。优点：集群扩容后，指定新的范围落在新节点即可，无需进行数据迁移。缺点：如果按时间划
分，数据热点分布不均(历史数冷当前数据热)，导致节点负荷不均。3.3ID取模分片缺点：扩容后需要迁移数据。3.2一致性Hash
算法优点：扩容后无需迁移数据。3.4Snowflake分片优点：扩容后无需迁移数据。4分库分表引入的问题4.1分布式事务参
见分布式事务的解决方案由于两阶段/三阶段提交对性能损耗大，可改用事务补偿机制。4.2跨节点JOIN对于单库JOIN，MyS
QL原生就支持；对于多库，出于性能考虑，不建议使用MySQL自带的JOIN，可以用以下方案避免跨节点JOIN：-全局表
:一些稳定的共用数据表，在各个数据库中都保存一份；-字段冗余:一些常用的共用字段，在各个数据表中都保存一份；-应用组装：应
用获取数据后再组装。另外，某个ID的用户信息在哪个节点，他的关联数据(比如订单)也在哪个节点，可以避免分布式查询。易火棋牌ht
tp://www.482223.com4.3跨节点聚合只能在应用程序端完成。但对于分页查询，每次大量聚合后再分页，性能欠佳。4.
4节点扩容节点扩容后，新的分片规则导致数据所属分片有变，因而需要迁移数据。5节点扩容方案相关资料:数据库秒级平滑扩容架构方案
5.1常规方案如果增加的节点数和扩容操作没有规划，那么绝大部分数据所属的分片都有变化，需要在分片间迁移：-预估迁移耗时，发布停
服公告；-停服(用户无法使用服务)，使用事先准备的迁移脚本，进行数据迁移；-修改为新的分片规则；-启动服务器。5.2免迁移
扩容采用双倍扩容策略，避免数据迁移。扩容前每个节点的数据，有一半要迁移至一个新增节点中，对应关系比较简单。具体操作如下(假设已有
2个节点A/B，要双倍扩容至A/A2/B/B2这4个节点)：-无需停止应用服务器；-新增两个数据库A2/B2作
为从库，设置主从同步关系为：A=>A2、B=>B2，直至主从数据同步完毕(早期数据可手工同步)；-调整分片规则并使之生效：原I
D%2=0=>A改为ID%4=0=>A,ID%4=2=>A2；原ID%2=1=>B改为ID%4=1=
>B,ID%4=3=>B2。-解除数据库实例的主从同步关系，并使之生效；-此时，四个节点的数据都已完整，只是有冗余(多
存了和自己配对的节点的那部分数据)，择机清除即可(过后随时进行，不影响业务)。6分库分表方案6.1代理层方式部署一台代理服务器
伪装成MySQL服务器，代理服务器负责与真实MySQL节点的对接，应用程序只和代理服务器对接。对应用程序是透明的。比如M
yCAT，官网，源码，参考文档：MyCAT+MySQL读写分离部署MyCAT后端可以支持MySQL,SQLServer,
?Oracle,?DB2,PostgreSQL等主流数据库，也支持MongoDB这种新型NoSQL方式的存储，未来还会支持更多类
型的存储。MyCAT不仅仅可以用作读写分离，以及分表分库、容灾管理，而且可以用于多租户应用开发、云平台基础设施，让你的架构具备很
强的适应性和灵活性。6.2应用层方式处于业务层和JDBC层中间，是以JAR包方式提供给应用调用，对代码有侵入性。主要方案
有：(1)淘宝网的TDDL:已于2012年关闭了维护通道，建议不要使用。(2)当当网的Sharding-JDBC:仍在
活跃维护中：是当当应用框架ddframe中，从关系型数据库模块dd-rdb中分离出来的数据库水平分片框架，实现透明化数据库
分库分表访问，实现了Snowflake分片算法；Sharding-JDBC定位为轻量Java框架，使用客户端直连数据库，无需额
外部署，无其他依赖，DBA也无需改变原有的运维方式。Sharding-JDBC分片策略灵活，可支持等号、between、in等多维
度分片，也可支持多分片键。SQL解析功能完善，支持聚合、分组、排序、limit、or等查询，并支持BindingTable以及笛
卡尔积表查询。移动电玩城http://www.44226.netSharding-JDBC直接封装JDBCAPI，可以理解为增强版的JDBC驱动，旧代码迁移成本几乎为零：-可适用于任何基于Java的ORM框架，如JPA、Hibernate、Mybatis、SpringJDBCTemplate或直接使用JDBC。-可基于任何第三方的数据库连接池，如DBCP、C3P0、BoneCP、Druid等。-理论上可支持任意实现JDBC规范的数据库。虽然目前仅支持MySQL，但已有支持Oracle、SQLServer等数据库的计划。

献花(0)

(本文系mjsws首藏)

类似文章 更多

发表评论：