千万级存储项目，为毛老司机也犯怵？

kaller_cui 2022-05-18 发布于北京

展开全文

最近两年

存储招标项目出现了1个大趋势

↓

新建的千万级存储大项目

嘿嘿，越来越多

这类项目随便搜搜就是一大把

……

因为对很多头部客户来说

政府、广电、医卫、证券、科研单位...

超大容量存储都变成了刚需

大家都在忙着一件事

↓

行业老司机们

碰到这类存储大项目

心情就变得相当复杂喽

大家心里都门儿清

以前客户存储要扩容，很简单

加点磁盘扩展柜就行

性能不够就把机头也升级下

项目搞起来都轻车熟路

很多都是延续性采购，单一来源

可现在

存储容量规模完全爆炸💥了

部署难度呈指数级上升

以前的搞法有点Hold不在

必须得找新的解决方案

那么，什么规模

才能称为海量存储？

↓

拿最近一个真实项目举例

450万预算，干了5个PB

所以，PB是海量存储的起步门槛

那么PB，又是什么级别呢？

你可以慢慢数一下，1024是进阶单位

再形象一点

如果1块硬盘存储容量按10T算

那么，1PB相当大概103块10T的硬盘

（10T*103块硬盘=1030T≈1PB）

这还不算副本的额外开销

现在稍有点规模的海量存储项目

动辄就是几十PB，夸张点的到几个EB

这类项目，对于厂商来说

不仅是一种“大考”，同时也是“大坑”

没点填坑实力，就只能喊救命了🆘

对于这种级别的存储来说

不仅考量超大的容量和扩展性

还要确保高性能、高可靠、高智能

↓

那么谁才是

国内海量存储部署的

“蓝波万厂商”？

↓

论单体规模

曙光拥有国内最大的

【EB级云存储实验室】

支撑大型行业应用系统

论实战规模

从2009年单套存储系统容量16PB

到2022年单套存储系统300PB

曙光不断突破业内存储容量极限

…

支撑这些大Case的产品

就是曙光海量存储系统的旗舰

ParaStor

↓

前面我们说过

海量存储系统“水深坑多”

那么曙光ParaStor

如何涉水避坑、海纳百川呢？

↓

挑战1：底层数据管理技术

底层数据管理，说白了

就是对海量磁盘的管理能力

这种管理

通常靠“磁盘文件系统”来完成

目前业界分布式存储系统

大多采用OS自带的本地文件系统

或者开源文件系统
（EXT4/ZFS等等）

进行底层磁盘管理

以降低代码开发量，缩短研发周期

这种间接的磁盘管理方式

无法更直接、高效地发挥磁盘性能

读写数据时要调用ext4、zfs接口

好比每次调用磁盘，还得先开一道门

海量存储系统，磁盘成千上万块

如果单磁盘的性能无法充分发挥

最终影响存储系统的整体性能和可靠性

而曙光希望直接操控磁盘

自研了一套高效的本地磁盘管理系统

叫作Object System

↓

Object System可以“精细化”操控磁盘

能精细化地控制磁盘布局

能精细化地控制磁盘读写

由此，数据负载更均衡，数据读写更快

还能精细化地一点点“抠出”

更多的存储空间

↓

这就涉及到了磁盘的存储利用率

也就是大家常说的「得盘率」

挑战2：不同场景下性能优化

海量存储应用也分场景

比如，AI场景的图像识别

就是典型的海量小文件的存储场景

每个小文件都是KB级的

在峰值阶段，每秒会生成大量小文件

都需要写入存储系统中

会产生高频随机I/O读写

这就是“小文件、大麻烦”的困境

在现实中，从成本考虑

客户的存储介质依然以机械磁盘为主

往往无法应对海量小文件的性能挑战

曙光ParaStor采用“混搭”方案

实现【机械磁盘+闪存】深度融合

高频热点IO需求，交给闪存完成

同时通过小文件合并、元数据缓存

动态智能预读等多种神操作

完美解决“小文件、大存储”的难题

同时又不会有明显成本增加

在某些新兴应用场景下

需要高性能的对象存储

ParaStor的对象接口

对IO协议栈进行极简优化

性能可达到业内领先水平

还有一些是大带宽场景

比如，非编、渲染、科研计算等

会产生大文件

有时单个文件达到TB级

这些场景下访问存储系统时

就需要大带宽

曙光ParaStor也有绝招

通过高性能网络RDMA协议、

专属高性能POSIX客户端等技术

能让单一客户端读写带宽均超过25GB/s

这指标，代表了业界最高水准

总之，曙光ParaStor完美匹配

对带宽、IOPS、时延的个性化需求场景

挑战3：一致性和高可靠性

1、一致性

海量存储系统必然伴随着

大量客户端的并发访问需求

必须保证数据访问的一致性

对此，曙光打造了一套分布式锁

DLM（Distributed Lock Management）

分布式锁是ParaStor的内嵌服务模块

是对于共享资源的高效协调器

实现所有客户端对于同一文件的有序访问

保证海量数据的强一致性

2、高可靠性

一个百PB级海量存储系统

运转着上万块磁盘

硬盘的状态监控和预警处理至关重要

如果没有智能的处理方式

那么就是一种毁灭性灾难

曙光ParaStor除了通过成熟技术

比如，多副本、纠删码等

来防范单故障外

还自研了一种算法

内部资源动态调度管理算法

专门针对大集群场景

实现故障智能化预处理

故障无感知自愈...

挑战4：异构数据统一纳管

曙光ParaStor的1个存储节点

真正实现了海量异构数据资源的融合

同时，曙光ParaStor还能提供

大数据存算分离解决方案

基于原生HDFS接口，无任何协议损耗

实现存储与计算资源按需配置的同时

满足新老存储同时读写

应用“0”改造，数据“0”迁移

挑战5：海量节点智能化管理

集群通常有数百甚至数千节点

各节点间的信息实时同步开销

会成为存储系统的不可承受之重

曙光ParaStor在集群通信管理模块中

以分组为单位进行管理信令交互

实现管理流量的去中心化错峰交互

集群信息秒级同步

存储厂商那么多

为啥曙光能成为

海量存储的领域的“扛把子”？

除了ParaStor存储本身技术过硬外

还有这么几点，也很值得琢磨

1、自研技术，高可控性

2009年，曙光就已经组建存储研发team

拥有国内一流的分布式存储研发团队

建队初始，曙光初心就是

把核心技术牢牢掌握在自己手上

↓

通过10多年的自研历程

曙光已经累积200余项核心技术发明专利

连续8年领跑国内分布式存储市场

（数据来源：IDC）

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： kaller_cui > 《云计算》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

kaller_cui

关注对话

TA的最新馆藏

ChatGTP全景图 | 背景技术篇
47页，智慧校园5G融合解决方案！
之江实验室与Science《科学》联合发布智能计算领域十大科学问题
浅谈边缘计算的安全威胁
谈谈CPU的时钟
2021数据资产运营白皮书

喜欢该文的人也喜欢更多

热门阅读换一换