分享

技术 | 手把手教你数字电影服务器存储系统故障的分析与维护

 昵称56665896 2018-08-01

「这是您阅读的第 864 篇文章」

From China Film Digital Cinema

自从去年GDC推出SR-1000独立媒体模块以来,有关数字影院媒体服务器,无需硬盘,稳定性倍增的讨论引起了业内人士的关注。电影播放时出现卡顿、中断的影院和设备厂商的技术人员反应尤其激烈。因为这些故障,绝大部分都是由服务器硬盘引起的。



我们知道,放映时,服务器通过不断地读取硬盘中的DCP(数字电影数据包)数据,进行解包、解密、解压缩等将数字电影一帧一帧的图像传送给放映机投影,由于一部影片由十几万乃至数十万帧图像组成,因而数据量非常庞大,其DCP文件容量往往在100G至200G之间,一般情况下,在放映之前需要将DCP文件导入到服务器的硬盘中。机械硬盘以其高性价比优势而被服务器厂商采用。


虽然机械硬盘理论上说寿命很长,但由于工作状况(温湿度、振动、灰尘等,以及不合理通断电带来的冲击)、数据读取的频繁程度将大大增加出错的几率并缩短工作寿命,产生放映卡顿、中断的概率大大增加。


目前,不少影院的服务器工作年限大都超过5年甚至达到10年,所以这类故障的产生变得十分常见。这次GDC推出的新型服务器,取消服务器外接存储,采用大容量的中央存储器,就是为了解决这个问题。


一、 数字电影服务器的存储器

                                                        



目前,电影服务器无一例外的都采用了机械硬盘作为其本地存储设备,只不过有的采用3.5吋的、有的采用2.5吋的,在性能上有的采用消费级有的采用服务器级,在放置位置上有的置于服务器机箱中(早期独立服务器,3.5吋硬盘)有的集成于IMB板上有的却单独外置(当前主流模式,2.5吋硬盘),容量大都在2-4T之间(1T=1000G=1000000M)。


这种解决方案的好处是各影厅独立,不好的方面是每部影片的DCP数据包都必须下载到每个服务器中,增加了放映员的工作量(不采用TMS的中央存储服务器)。


我们知道,机械硬盘的容量一直在增加,目前单个硬盘的容量可以做到10T,主流硬盘也都在2-4T,但目前服务器厂商采用的大都为1T的硬盘,如何才能达到2-4T的存储空间呢?


一般采用的是“独立磁盘构成的具有冗余能力的阵列”技术,英文是Redundant Arrays of Independent Disks,简称RAID。


RAID目前分为数个级别,分别是RAID0、RAID1、RAID3、RAID5、RAID6、RAID7、RAID10、RAID53、RAID100等。


主流 RAID 等级技术对比


综合多项性能,目前服务器采用的是RAID5技术。这是一种兼顾存储性能、数据安全和存储成本的解决方案。具有扩大单盘容量、提高数据读写速度的优势,因而用3个或以上硬盘来组成硬盘阵列,降低单盘容量、扩大存储容量,同时提高可靠性并降低成本。 


RAID 5可以理解为是RAID 0和RAID 1的折中方案。RAID 5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低,是目前运用较多的一种解决方案。


二、 服务器硬盘的检测和RAID的建立

                                                                       



我们以影院用的比较多的GDC SX-3000IMB以及便携型PSD-3000P存储器为例来说明。



在服务器待机状态的SMS界面,点击“控制面板”,出现如下界面:

 


点击Admin panel按钮,出现如下界面:

 


 选择“gdc”用户并输入密码“configos”,然后点击“登入(Login)”按钮,出现管理面板主菜单,如下图:



选择1.存储系统管理,将会弹出一个存储系统管理窗口菜单,出现下图:


图8


里面有六个选项可选,我们选“硬盘信息”,就出现以下界面:



通过点击要查看的硬盘,选“Select”,出现如下信息:

 


选择“Save output USB”,可以将此硬盘信息存储到外接U盘中,或选择“Back”,回到图8的界面,选择“存储效率”,会出现下图界面:



SX-3000服务器将外置存储模块加载为一个磁盘的形式进行使用,只能对整个外置存储模块进行检测,选项/dev/sdb为存储模块读写性能测试的功能菜单。单个数据硬盘的检测由外置存储模块自行进行,通过硬盘指示灯状态进行辨别见下表:



通过点击要查看的硬盘,选“Select”,出现如下信息:



选择“Save output USB”,可以将此硬盘信息存储到外接U盘中,或选择“Back”,回到图8的界面。


当某一块数据硬盘出现问题时,服务器出现RAID降级,此时服务器开机都会有信息警示,如图所示:



我们也可以在服务器待机状态的SMS界面,点击“控制面板”,出现如下界面:



RAID降级虽还不至于中断放映,但我们应该及时根据便携式硬盘盒的指示灯,更换同一型号的新硬盘。


注意:如果仅更换一块硬盘,只要服务器进行重启,系统会自动进行修复仍可正常工作。当我们同时更换两块硬盘,我们就须重新创建新的RAID。


具体步骤是:选择图8的“创建新的冗余存储阵列”,此时出现以下界面:

 


当作为SX-3000存储使用时选择 SX-3000 PSD。


仅当和GDC TMS一起使用时选择 Backup PSD 。


通过单击屏幕键盘上的右箭头键[→]或左箭头键[←]来选择Ok或Cancel以确认或取消所做的选择 。


如果安装在PSD-3000-P的HDD少于3个,将会弹出一个错误的对话框。



在创建新的磁盘阵列前应确保不少于3个HDD安装在PSD-3000-P内。选“Ok”,则出现如下界面:



当阵列被创建后,将会弹出如下的对话框:



点击“OK”,RAID创建完成。回到SMS界面,



点解“设置”按钮,出现以下界面:

 


点击IMB存储选项卡:



如上图所示,选择第三选项,配置SX-3000使用一个附加的eSATA RAID数据存储,这需要和便携型/企业级存储系统配套使用,就完成了RAID的挂载。


查看服务器的RAID状态,比如GDC服务器可以直接在控制面板中查看,图中显示OS、R1、R2、R3均为“OK”,冗余存储状态:在线。但如果硬盘出现问题,冗余存储状态:Degrade(降级)



三、 服务器设计硬盘的故障讨论

                                                          



一般来说,硬盘在正常工作情况下寿命还是比较长的,所谓正常情况,就是每天工作时间8小时以内、数据读取量不大、不会频繁地通断电,比如办公电脑,不考虑电脑性能升级,一般可长达5-8年。但是,影院的电影服务器在工作时间、数据读取强度以及开关机等方面都远超普通电脑的工作状况。因此,实际上其使用寿命一般都没那么长,这也就是最近几年来涉及硬盘的故障越来越多的原因。


而且随着服务器工作时间的增加、硬盘内部温度的升高(与机房环境温度有关),硬盘的故障率也会有所提高。有研究表明,当硬盘外壳的温度由30度(接近室温)上升至70度时,发生故障的概率上升约3.4 倍。加上服务器不正确关机、异常中断磁盘的读写、物理撞击和剧烈振动等因素,都可能导致硬盘性能降低或损坏,严重的硬盘错误甚至可能导致服务器无法开启。


虽然采用RAID技术后,可以提高数据读取的速度,并且在有硬盘损坏的情况下,降低读取速度仍可保证正常工作,但造成放映卡顿、中断还是不可避免,而且跟单个硬盘的品质性能(消费级、服务器级)等有很大的关系。


通过前面的介绍,GDC服务器可以对硬盘的工作情况、技术状况等进行查看,还可以导出作为技术档案,我们在服务器投入使用时,进行读写性能检测并记录结果,可以为今后的故障判断提供参考。在进行读写性能检测时,需要注意三个数据硬盘间的读取速度不能相差太大,我们一般建议读取速度最低的硬盘其数值与另两块硬盘读取速度数值相差超过20MB/秒时即考虑更换。


为降低硬盘数据读取强度,我们不建议在放映时进行导片、删除等操作,此外,数字电影服务器出现阵列降级时一般会进行阵列的自动修复,服务器是否正在阵列修复可以通过查看数据磁盘状态指示灯状态(红灯不停闪烁),或者通过菜单查看相关信息进行判断。假如服务器无法进行阵列的自动修复,则按前述方法更换故障硬盘重建RAID来解决。


四、服务器硬盘维护

                                    



不要以为服务器只要能工作就无所谓维护,同样服务器硬盘作为精密度较高的机电一体化产品,更要注意使用和维护,这样才能延长工作寿命,降低故障风险,做到安全优质放映。具体要做到:


1、保持电脑工作环境清洁


硬盘已带有超精过滤纸的呼吸孔与外界相通,它可以在普通无净化装置的室内环境中使用,若在灰尘严重的环境下,会被吸附到PCBA的表面、主轴电机的内部以及堵塞呼吸过滤器,因此必须防尘。还有环境潮湿、电压不稳定都可能导致硬盘损坏。


2、养成正确关机的习惯


硬盘在工作时突然关闭电源,可能会导致磁头与盘片猛烈磨擦而损坏硬盘,还会使磁头不能正确复位而造成硬盘的划伤。因此,严格禁止直接切断电源的方法关机,对于频繁断电的地区,要配置不间断电源。


3、在工作时,不要移动硬盘,注意防震


在工作时硬盘高速转动,轻轻的震动都可能碟片与读写头相互磨擦而产生磁片坏轨或读写头毁损。所以在开机的状态下,千万不要移动硬盘或机箱,最好等待关机十几秒硬盘完全停转后再移动主机或重新启动电源,可避免电源因瞬间突波对硬盘造成伤害。服务器机箱或便携式存储盒等必须放置平稳避免摇晃。要明白硬盘厂商所谓的“抗撞能力”或“防震系统”等,指在硬盘在未启动状态下的防震、抗撞能力,而非开机状态。


4、机房温度适宜


目前,大多数机房都安装有空调,一般能保证机房室温保持在30度以下,但由于放映机安装有抽风散热风机,新风进入较多,使得室温很难降下来,因此要注意观察室温,对空调制冷能力不足的,要更换制冷量大的空调,确保机房温度在25度左右,这样不但对放映机有利对降低服务器故障发生也是有利的。

 

当然,要比较好地规避由于服务器硬盘带来的故障隐患,采用GDC公司推出的SR-1000无本地硬盘服务器不失为一个很好地解决方案。由于系统按高标准配置(医疗、军用级标准)、完善的中央机房条件:供电、温湿度等,远非普通机房所能达到,结合其CA2.0系统,不但可靠性大大提高,存储容量提高10倍达到32T,可存储1000部影片,同时避免了对每个影厅服务器的影片导入,还因为采用USB3.0标准,导入影片时间大大缩短,可以说是服务器技术的一次革命,受到广泛关注和影院的欢迎是必然的。


(本文原载于《艾维电影》2018年6月期杂志)


特别提醒:本文整理自 GDC环球数码科技,旨在分享交流目的使用,不用作任何商业用途,基于此产生的法律责任本公号不承担连带责任。


中影数字电影发展(北京)有限公司成立于2003年12月4日,是目前国内最大的从事数字影片发行放映服务的经营商。作为中影股份全资子公司,公司宗旨是贯彻落实国家数字电影发展规划,致力开发建设数字影片发行平台,为片方和各级市场影院提供数字影片发行放映服务。针对当下电影产业的新风口--点播影院,公司将致力于点播影院市场合法合规运营,为各点播院线/影院提供发行放映服务。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多