分享

一次存储故障让我见识了存储内部

 by1010 2016-10-23

之前服务器内部我们都看过,但我相信很少有人见过存储的主机构造,今天借着维修存储的机会看看存储的内部构造。先说说存储发生什么问题了呢?我这是一台netapp 3250,发生了什么问题呢?先从系统看。由双机热备(HA)组成的存储有一台已经挂了(failover),另一台接管了发生错误的主机。这时存储管理界面报错。

正常来说一台挂了,如果非硬件故障的情况下是可以giveback的,即可以通过giveback切换回来。

但之前已出现过此相同问题,报修后厂家要求我保留当前状态,等厂家上门判断。当然我一点也不担心,毕竟没有影响到业务。

在等待厂家上门的前面我们了解一下,存储的分类。

存储分类磁盘存储市场上,一般分封闭系统的存储和开放系统的存储,封闭系统主要指大型机,AS400等服务器,开放系统指基于包括Windows、UNIX、Linux等操作系统的服务器;开放系统的存储分为:内置存储和外挂存储;开放系统的外挂存储根据连接的方式分为:直连式存储(Direct-Attached Storage,简称DAS)和网络化存储(Fabric-Attached Storage,简称FAS);开放系统的网络化存储根据传输协议又分为:网络接入存储(Network-Attached Storage,简称NAS)和存储区域网络(Storage Area Network,简称SAN)。

而这种存储叫:NETAPP存储,属于FAS,它的型号一般就是fas20xx,fas30xx,fas80xx等等。

这款出问题的存储就是netapp FAS3250,它的外观是这样的。

正面照正面照可以看出报警灯已亮。(嘿嘿,面板灰有点大),上面两个是机头,下面是磁盘柜,可以看到亮黄灯的就是坏的主机,放大可以看到标识node2.

背面照线比较乱了,当时上线比较急,就不管它乱的问题了,但它的连线方法还是很复杂的。

好了厂家来了,之前厂家根据错误log已经无法判断是何故障,建议之前发生过此类问题,所以拿出了必杀技。必杀技:更换主机硬件首先把主机拆下来,抽出主机。主机是这个样子的。

这里一一介绍1-电池:缓存电池,为什么这么大,就是主机即使掉电了,也就是说即使异常掉电也会保障存储重要配置数据。2.内存:缓存3、内存:主机内存。40G、4条。4、数据卡:这个重要了,所有的配置数据都存在此处,也就是主机的存储。你可以将此卡迁移到相应的型号主机,而配置不变。5、这个是个盖子下面是CPU,里面有两个大的散热片。(双CPU)6、\这个无法直接拆开,里面包含两个FC卡,也就是光纤模块卡。更换主机,只要把1、2、3、4、6的设备迁移到新主机内即可。截取了拆卸过程中几张图片

CPU上面的散热片

数据卡

FC卡

安装过程就很简单了,一个机器的配件移到另一台机器,没什么可讲的。有人看到这说,问题解决了码?我们想看看如何解决的,其实看了以上的步骤,是否解决问题已经不言而喻了,硬件全换了,您说还会有问题吗?其实呀有些问题还是比较诡异的,其实对于用户还是厂家最重要的是最快的方法解决问题。

硬件构造大同小异,有空讲讲netapp的存储的系统运维,还是比较复杂的;但每个品牌的存储都有自身的系统命令和配置方法,但属于小众中的小众。我一向认为会用即可,不必深研究,毕竟我们还有厂商支持。

今天就说到这里,可能有些人是拆过存储的,反正我是头一次见,以此文留念。

如果您对我的文章感兴趣,请关注我的微信公众号:ithelpyou.或长按下面图片,识别二维码关注。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多