分享

CAP原理和BASE思想...

 ~水手~!! 2011-06-09
分布式领域CAP理论,
Consistency(一致性), 数据一致更新,所有数据变动都是同步的
Availability(可用性), 好的响应性能
Partition tolerance(分区容错性) 可靠性

定理:任何分布式系统只可同时满足二点,没法三者兼顾。
忠告:架构师不要将精力浪费在如何设计能满足三者的完美分布式系统,而是应该进行取舍。

关系数据库的ACID模型拥有 高一致性 + 可用性 很难进行分区:
Atomicity原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
Consistency一致性. 在事务开始或结束时,数据库应该在一致状态。
Isolation隔离层. 事务将假定只有它自己在操作数据库,彼此不知晓。
Durability. 一旦事务完成,就不能返回。
跨数据库事务:2PC (two-phase commit), 2PC is the anti-scalability pattern (Pat Helland) 是反可伸缩模式的,JavaEE中的JTA事务可以支持2PC。因为2PC是反模式,尽量不要使用2PC,使用BASE来回避。

BASE模型反ACID模型,完全不同ACID模型,牺牲高一致性,获得可用性或可靠性:
Basically Available基本可用。支持分区失败(e.g. sharding碎片划分数据库)
Soft state软状态 状态可以有一段时间不同步,异步。
Eventually consistent最终一致,最终数据是一致的就可以了,而不是时时高一致。

BASE思想的主要实现有
1.按功能划分数据库
2.sharding碎片

BASE思想主要强调基本的可用性,如果你需要High 可用性,也就是纯粹的高性能,那么就要以一致性或容错性为牺牲,BASE思想的方案在性能上还是有潜力可挖的。

现在NoSQL运动丰富了拓展了BASE思想,可按照具体情况定制特别方案,比如忽视一致性,获得高可用性等等,NOSQL应该有下面两个流派:
1. Key-Value存储,如Amaze Dynamo等,可根据CAP三原则灵活选择不同倾向的数据库产品。
2. 领域模型 + 分布式缓存 + 存储 (Qi4j和NoSQL运动),可根据CAP三原则结合自己项目定制灵活的分布式方案,难度高。

这两者共同点:都是关系数据库SQL以外的可选方案,逻辑随着数据分布,任何模型都可以自己持久化,将数据处理和数据存储分离,将读和写分离,存储可以是异步或同步,取决于对一致性的要求程度。

不同点:NOSQL之类的Key-Value存储产品是和关系数据库头碰头的产品BOX,可以适合非Java如PHP RUBY等领域,是一种可以拿来就用的产品,而领域模型 + 分布式缓存 + 存储是一种复杂的架构解决方案,不是产品,但这种方式更灵活,更应该是架构师必须掌握的。

[该贴被banq于2009-11-12 09:31修改过]
[该贴被admin于2011-05-03 10:15修改过]
xmuzyu


个人详介按这里
发表文章: 443
注册时间: 2007年03月26日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言 23人关注
CAP原理和BASE思想 2009年11月12日 20:06 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
同意banq老师的观点。BASE讲究soft state,这种状态是一种非即时性的状态,是一种无连接,或者说是尽量短连接的状态,而ACID是讲究强的一致性,要求即时性的事务hard state,这是一种完全面向连接的状态。强的一致性就以牺牲性能和高可用性为代价,目前 JDON的风格是一种符合BASE策略的架构风格。
conquersky


个人详介按这里
发表文章: 12
注册时间: 2009年04月24日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言
CAP原理和BASE思想 2009年11月12日 23:06 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
感觉 jdon的首页 有点base的味道啊 呵呵
banq


个人详介按这里
发表文章: 11777
注册时间: 2002年08月03日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言 118人关注
回复:CAP原理和BASE思想 2009年11月13日 10:51 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
提供一种领域模型 + 分布式缓存 + 存储 + JMS异步的BASE解决方案图,如下,在这张图中,领域模型带着逻辑和数据被分布式缓存如Ehcache +Terracotta分布到多台机器中运行,当领域模型需要驱动架构功能时,通过JMS驱动,而JMS也是一个集群无单点风险的架构,同时一个分布式事务架构,通过JMS分布式事务和关系数据库能够保证持久数据一致性,不过模型中数据和关系数据库中的数据一致性就不是高度实时的,这个方案属于一种低延迟low latency。

由于业务数据装在领域模型中,关系数据库只是用来做存储,这属于一种Not Only SQL。


[该贴被admin于2009-11-13 11:00修改过]
lazytalent


个人详介按这里
发表文章: 4
注册时间: 2007年11月26日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言
回复:CAP原理和BASE思想 2009年11月16日 10:39 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
XXXXX,没有什么对不对,好不好,只有适合与否,讨论的时候最好事针对一个特定的环境!!!
banq


个人详介按这里
发表文章: 11777
注册时间: 2002年08月03日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言 118人关注
回复:CAP原理和BASE思想 2009年12月14日 13:49 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
相关话题
并发策略可以解决延迟

伸缩性和可用性反模式
dsw


个人详介按这里
发表文章: 1
注册时间: 2010年11月16日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言
CAP原理和BASE思想 2010年11月16日 11:30 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
banq您好!“关系数据库的ACID模型拥有 高一致性 + 可靠性 丧失可用性:”这句是不是有问题,应该是高一致性 + 可用性 丧失了可靠性吧?如果错了,请您指导!谢谢!
fa


个人详介按这里
发表文章: 1
注册时间: 2010年12月03日
悄悄话
个人博客
在线?当前离线
我要关注该作者发言
CAP原理和BASE思想 2010年12月03日 10:04 关注本主题 到本帖网址 加入本帖到收藏夹 网上收藏本主题 手机条码扫描浏览本页 请用鼠标选择需要回复的文字再点按本回复键 回复该主题
楼上

请问下在wifi测试中CAP ID主要测得是什么???谢谢

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多