存储选型与规划发表人:tianweiping2008 | 发表时间: 2009年九月03日, 14:19
一、选型前准备 首先确认以下几点: 1、资金预算多少 2、快速响应优先还是高可靠性优先 3、如何评估存储的处理能力,是希望有更强的IO处理能力还是有更大的带宽 4、如何衡量存储的最终性价比 二、存储体系结构 1、低端存储 一般只有一个控制器,基本没有cache或者有很少的cache,所以整体响应速度慢,而且基本没有冗余,可靠性差,一般适用于可靠性要求不高的应用,或者用来做备份。 2、中端存储 一般采用双控,有较多的cache或链路,而且开始注意冗余,这个区间的存储,控制器是核心部分,如果有1个控制器坏掉,带来的性能降低会超过50%,因为损坏一个控制器后写cache会自动关闭,性能受到极大影响。 3、高端存储 一般采用多控,并采用以cache为核心的体系结构。多控的结构中,损坏其中某个控制器对整体性能影响比较小。 一般情况下,中端存储是性价比较高的可选产品,对于可靠性及响应要求极高的应用,会采用高端存储,比如银行、电信、移动等。 三、存储的cache技术 存储的cache无处不在,硬盘、存储、RAID卡都有cache,我们从cache写、cache读与cache设计说明: 1、cache写 在 cache写环境下,只要写到cache,存储就反馈为写完成,该过程是非常快的,通过写cache的镜像与电池保护,保证写到cache但还为写到磁盘 上的数据不丢失,该方式对于RAID5影响尤为明显,所以对于单控的存储,是无法开启cache写功能,对于双控上坏掉1个控制器的情况,也会自动关闭写 cache,所以性能会有很大影响。建议在任何情况下,都不要关闭cache写功能。 2、cache读 对于要读取的数据在cache中,我们称之为cache命中,否则为cache miss,cache读比磁盘读至少快5倍,所以对于高端存储,cache是核心部件,一般都有比较大的cache尺寸。cache读对于OLAP系统影响不大。 四、存储评估指标 存储评估指标有:iops、throughput、响应时间。一般来说,对于比较频繁的OLTP系统,更多考虑iops与响应时间,对于OLAP,一般考虑带宽 1、iops 决定iops因素:磁盘个数、cache命中率、阵列算法。 磁盘个数是决定iops最重要的因素,磁盘类型与iops关系如下: 10k rpm 15k rpm ata 100 150 50 上 述值为理论值,而且是没有包含cache命中部分,对于实际情况中,该理论值还会增加,但是对于我们预估存储iops时,不能按照理论值去算。比如:假定 cache命中率在实际业务中能达到20%,则对于15k rpm盘的理论iops为150/0.8=187.5。影响iops的另一个因素是阵列算法,如cache算法、寻道算法、预读算法 2、throughput(带宽) 吞吐量主要取决于:磁盘个数、光纤通道的数量和带宽、阵列构架 与iops一样,每个物理硬盘也有其最大支撑的流量大小,硬盘类型与最大流量的关系: 10k rpm 15k rpm ata 10m/s 13m/s 8m/s 假 定有个阵列有100块15 rpm光纤盘,从带宽角度可以支撑最大为:100*13m/s=1300m/s,接着考虑光纤通道大小,对于1块2G的HBA卡,可以支持最多2048m /8=256m的实际流量,需要配置1300/256=5.07块HBA卡才可以满足要求。对于OLAP系统,一般会选择4G或更大的HBA卡。 3、响应时间 单 IO响应时间和iops的当前值、吞吐量大小及cache命中率都有密切关系。经验值表示:一个IO的响应时间在20ms以内,应用基本可以正常工作,做 为一个核心的高可用OLTP环境,最佳的单IO响应时间建议在10ms以内。如果应用是频繁的OLTP系统,应先考虑iops因素,选择合适的阵列算法, 配置较多且较快的磁盘及cache大小。如果是典型的OLAP系统,需要考虑存储系统带宽与存储的光纤通道带宽,配置适当的硬盘个数,这时一般不用考虑 cache大小。 五、最终选型决定 1、成本预算问题 2、响应速度与可靠性的选择 对于中端存储提供的响应速度,在相同磁盘数量下和高端存储差别不大,但是稳定性却比高端存储低很多 3、存储的评估指标 需要了解自己的业务,是偏重于IOPS的OLTP系统,还是偏重于带宽的OLAP系统。 4、存储的性价比 六、存储构架 在描述前,有几个名词需要熟悉一下: 1、前端口:主要是连接存储和主机,流行2G/4G。 2、后端口:主要是连接存储和磁盘,一般连接方式有环路方式和交换方式 3、控制器:中低端存储的核心部件,控制器包括自己的OS、CPU与内存,负责存储的运行与调度 4、cache:在中低端存储中,是包含在控制器中的,但在高端存储中,是以cache为核心,负责前端与后端的交互和通信。 5、 RAID:冗余磁盘阵列技术,通过对多个硬盘进行条带化处理,并通过数据镜像或者校验方式,将镜像数据或者是校验数据分布在多个磁盘。在一个磁盘损坏的时 候,因为数据镜像或校验还存在,所以不影响系统的正常运行。当更换新的磁盘时,可以通过镜像数据或者是校验数据来恢复这个盘的数据,回到最初状态,这个过 程叫rebuild。一般的RAID保护中,都放入一定的热备盘,当有盘损坏时,先rebuild到热备磁盘上,更换新的硬盘时,再rebuild到新的 盘上。 |
|