配色: 字号:
算力网络及其演进与应用(6)
2024-01-31 | 阅:  转:  |  分享 
  
算力网络及其演进与应用(6)

胡经国



(续前)

九、算力网络是如何工作的?

1、算力网络的核心特征

大家知道,算力网络的作用是为用户提供算力资源服务。它将算力资源“彻底融入”通信网络,以一个更加整体的形式(一体化的形式),提供最符合用户需求的算力资源服务。它是一个高度灵活、高度智能的网络。

算力网络的核心特征是:通过算力,实现了对算力资源与网络资源的全面接管,可以让网络实时感知用户的算力需求,以及自身的算力状态。在经过分析以后,算力网络可以调度不同位置、不同类型的算力资源,为用户服务。

我们可以把它理解成一个“万能水龙头”。它总能够按你的需要,提供“合适强度、合适温度、合适酸碱度的水流”,让你拥有最好的“用水体验”。

那么,我们自然会很好奇,这个“万能水龙头”的背后,究竟是一张怎样的“水网”?它是如何进行资源控制和调度的?

下面,就来介绍算力网络的(组网)架构。

2、算力网络的(组网)架构(设想)

首先,需要提前说明,算力网络目前还是一项研究中的技术,并且没有完全定型。所以,我下面给出的,只是各个运营商和设备商的算力网络架构(设想),相互之间会存在一定的差异。而且,未来也很可能会发生变动。

下面,介绍运营商和设备商比较有代表性的算力网络架构(设想)。

⑴、算网基础设施层

算力网络架构的最下层是基础设施层。在算力网络中,基础设施不再仅仅是算力资源(CPU、存储、GPU等),还包括网络资源。(下图源:网络)

在算力资源这边,对算力基础设施的整合,依旧是以云技术为核心,包括云原生、虚拟化、容器等。

在这里,和算力有关的一些底层新技术创新,也值得关注,如异构计算、无服务计算(Serverless Computing)、存算一体、算力卸载等。

在网络这边,在云网融合趋势下的网络变化比较大。用一句话来解释,就是把封闭的网,变得更加开放(解耦);让它变成像计算机一样,可以通过软件的方式(软件定义),去给它下“命令”。

网络的底层(物理层、数据链路层),有传输网和接入网。变化大的,在网的上层。





⑵、算网一体层(算力资源管理、网络资源管理)

由于算力网络需要调度算力资源和网络资源,因而需要对资源进行“预处理”和“衔接”。(这一层,其实在很多类似架构里都归于管理编排层。在这里单独拎出来,会比较容易理解一些。)

这一层,最值得关注的是“算力路由”。算力网络和传统网络的最大区别在于它具有三大特性。其第一大特性就是“算力路由”。

①、算力感知

在算力路由之前,先要说一下“算力感知”。

“算力感知”是指网络对于算力资源和算力服务的部署位置、实时状态、负载信息、业务需求的全面感知。中国移动的《算力感知网络白皮书》,就是站在“算力感知”的角度,进行分析的。

一方面,各个算力节点将算网信息度量建模以后统一发布,网络通过对多节点上报的算网信息进行聚合,构建全局统一的算网状态视图。另一方面,网络完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。

简单地说,算力感知的目的就是“摸清手上”到底有多少资源,用户到底有怎样的需求。

②、算力度量和算力标识

对于感知的对象,肯定需要进行度量和标识。于是,就有了“算力度量”和“算力标识”。对于这两块,运营商目前非常重视。

由于算力这个东西存在“多样性”,也存在“异构硬件芯片”,因而目前还没有形成统一的度量体系和标准。这会对建立统一的算力模型造成麻烦。那么,度量单位都不一样,如何进行算力评估和计费?

“算力标识”就相当于“算力的身份证”。用户通过算力标识,指示所需要的服务;网络通过解析算力标识,获取目标算力服务、算力需求等信息,为算力调度等提供基础。因此,算力标识必须是全局统一的和可验证的。

③、算力路由

接下来,就要说到“算力路由”。

在这里,先介绍一下什么是“路由”?

“路由”(Routing),是指通过互联的网络把信息从源地址传输到目的地址的活动。路由发生在OSI(Open System Interconnection,开放式系统互联)网络参考模型中的第三层即网络层。路由引导“封包转送”,在经过一些中间节点以后,到达它们最后的目的地。若作成硬件的话,则称为“路由器”。路由通常根据“路由表”——一个储存到达各个目的地的最佳路径的表——来引导“封包转送”。因此,为了有效率地转送封包,建立储存在路由器内存内的“路由表”是非常重要的。

在中国移动的“算力感知网络架构图”里,在“算力资源层”之外,还单独划分了一个“算力路由层”。

“算力路由层”是算力感知网络的核心功能层;支持对网络、计算、存储等多维资源、服务的感知与通告,实现“网络+计算”的联合调度。

“算力路由层”包括:算力路由“控制技术”和算力路由“转发技术”,以实现业务请求在路由层的按需调度。

说到“算力路由”,肯定就要说到“计算优先网络”(Computing First Networking,CFN)。

在广义上,CFN有时候会被用来指代整个算力网络。但是,在这里,CFN是一种“分布式路由协议”;在不同“边缘云”之间,按需进行算力的调度和均衡。

传统理解的“路由”都是“数据报文”的路由。在这里,CFN的路由,是将计算资源状况和网络资源状况作为路由信息,发布到网络。然后,网络基于虚拟的服务ID,将“计算任务报文”,路由到最合适的计算节点。

目前,“CFN协议”主要通过在“业务路由”的“BGP报文头”中,以扩展字节信息的方式携带算力信息,将网络中计算节点的负载情况实时向全网进行扩散。

很显然,算力路由和CFN,是上一层进行“算力调度”的前提。

⑶、管理编排层

算力网络的核心关键部分是管理编排层。

在核心网的NFV(网元功能虚拟化)架构里,就有“编排”。“编排”是一个很有意思的词,字面意思是“收编、安排”;说白了,就是“完全控制和调度”。

①、算力调度

算力网络的第二大特性就是“算力调度”。“算力调度”,就是基于算网大脑,进行全网算力资源的智能编排、弹性调度。更具体来说,就是:完成算力运营及算力服务编排,完成对算力资源和网络资源的管理,包括对算力资源的感知、度量和OAM管理等;实现对终端用户的算网运营,以及对算力路由层和网络资源层的管理。

②、算力资源管理

算力资源在被度量、标识和感知之后,为了进行管理,还有一个算力资源管理的逻辑过程(也有的将其单独称为:算力管理层)。其中主要包括:算力注册、算力OAM(性能监控、故障管理)、算力运营(计费管理、服务合约等)。

这个功能划分就很麻烦。在有的运营商架构图里,这块被定义为“算力管理层”,单独存在。而在有的架构图里,则没有这一层,将其划在了“管理编排层”。所以说,各个理解都不一样;反正大家要知道,有这么一个功能组。

③、算网大脑

想要实现它,肯定离不开一个控制网络的“神经中枢”。

调度和编排算力网络的核心控制部分,有的运营商把它叫做“算网大脑”。

这个“算网大脑”具有以下4个重要作用:

①-1、获取全域实时的“算、网、数”资源及“云、边、端”分布情况,构建全域态势感知地图。

②-2、跨域协同调度,将多域协同的调度任务智能、自动地分解给各个使能平台,实现“算、网、数”资源调度。

③-3、多域融合编排,针对多域融合业务需求,基于“算、网、数”的原子能力按需灵活组合编排。

④-4、智能辅助决策,基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出“算、网、数”的最优协同策略。

总而言之,通过算网管理编排层,维护全局静态的算力、服务和网络拓扑信息,并且同步给各入口算力路由节点;通过算力路由节点,维护算力服务的拓扑信息以及算力资源和网络资源实时状态信息;通过分布式算力路由节点,进行算网协同调度。

“算网大脑”是算力网络的神经中枢,由它统筹全局资源,其重要性不言而喻。在“算网大脑”中引入AI人工智能,那肯定是不用说了。除了AI之外,现在,运营商和设备商还打算往里面加入“数字孪生”、“意图引擎”,极力提升“算网大脑”的智能化水平。

实际上,由“管理编排层”可知,算力网络就是SDN(Software Defined Network,软件定义网络)和NFV(Network element Function Virtualization,网元功能虚拟化)技术的升级加融合,处处都是这两项技术的影子。只不过,表面又加上很多其它技术,形成了一个更完整、更庞大的体系。

⑷、算力运营层(服务营运层)

在“算力大脑”之上,还有一个“算力运营层”。

算力运营层的功能就是给上层用户和应用提供管控算力网络的接口。“算网大脑”不是真正的“老板”,只是一个“大管家”。真正管控网络的是上层用户和应用。

算力运营层的目的,就是向上提供算力网络的能力开放。其重点的技术包括:算力交易、算力并网、算力封装、意图感知等。

算力交易

算力网络的第三大特性,就是“算力交易”。“算力交易”是算力网络的一个重要创新。

在算力和网络没有融合之前,用户使用谁家的云计算,就给谁家钱,使用谁家的通信网络,就给谁家钱。在算网融合以后,算力到处都是,调度来调度去,你到底该给谁钱?算力交易,就是为了解决这个问题。

在算力交易场景中,会有一个“可信泛在算力交易平台”。算力交易的大致过程是这样的:

首先,算力消费方提出详细的算力需求。

然后,算力交易平台根据需求,将可用的资源整合,生成一个算力网络资源表。根据时延和成本等因素,会有对应的报价。

接下来,算力消费方根据算力网络资源表,选择一个最适合自己的“套餐”。

然后,在算力交易平台上签订交易合约。

再然后,交易平台根据签订交易合约,通过算力网络调度资源,并且更新资源信息。

最后,合约结束,服务终止,释放资源。

在21世纪,凡是提到交易模式,就一定会牵扯到一个词——区块链。算力交易平台,也是借助区块链技术,来实现分布式账本、匿名交易等功能的。

综上所述,算力网络紧密围绕用户的算力需求,覆盖了算力产生、调度、交易、消费的全生命周期。算力网络想要实现的,就是“算随人动”,“算随需求动”,达到极致完美的算力供给与需求匹配,一点也不将就,一点也不浪费。

3、中国算力网络建设进展概况

这几年,算力网络在中国国内非常热门;不管是运营商还是设备商,尤其是运营商,都极为重视这个概念。

其原因很简单,国外运营商很少“碰网”,基本上就是搞搞通信,最多搞搞传统通信的云化。而中国国内运营商,既有网又有云,特别希望把网和云的资源融合、盘活。而且,中国国家比较重视基础设施建设,算力网络是重要的数字基础设施。所以,运营商作为国企,也特别看重这一领域的积累。

一方面为了掌握技术标准的主动权;另一方面为了品牌宣传和形象造势,三大运营商在算力网络上就开始“卷起来了”。

2019年是公认的算力网络元年。在该年11月1日,中国联通率先行动,在北京PT展期间,发布了《中国联通算力网络白皮书》。这是中国国内第一本和算力网络相关的白皮书。

此后,中国国内运营商们先后陆续发布了多本算力网络白皮书,并且积极推动算力网络标准制定。(下表来源:网络)



有关试验进展,如下表所示:



从实际情况来看,算力网络离我们还有很长一段距离。目前,我们处于云网融合的进展阶段,而算网一体或算力网络则尚处于研究阶段。

尽管如此,算力网络作为“算力”和“联接力”未来的发展趋势,是毋庸置疑的。算与网的融合一体,是必然的,也是整个通信行业的归途。传统通信作为“管道”,无法提升自己的价值;唯有全面投入云的怀抱,才是最好的出路。大家有兴趣的话,可以仔细在研读一下上述运营商的白皮书。

(未完待续)









7







献花(0)
+1
(本文系现代科普图...原创)