配色: 字号:
布式缓存技术及其在物联网中的应用
2013-04-22 | 阅:  转:  |  分享 
  
万方数据

分布式缓存技术殛其在物联网中的应用

图1Amazon分布式缓存业务架构

供高效的汁算能力海砬的存储能

力,为泛在链接的物联网提供阿络引

擎和支撑,

狂彳联阿应用刚起步时,符种平

台太多采州的是关系碰数据库那

时PC机昂贵,性能低下计儿网络小

普炷,而关系喂数据库尚为处理能力

强、数据安全uf稚、敛性好等优势.

一直处于丰导地位,井发挥r重要的

作用。随着互联网的发展,特别是

WEB2.0等交q式、个性化成JH的出

现,数据鼠急剧增JJⅡ,传统的盖系型

数据库已经无法满足这种快速增长

的存储需求为此不少¨服务提供

商都世汁开发丁FlL的存储系统.如

亚码逊在2(}07年10月份"发小的

Dynamo就是其中非常典型的一种仵

储系统(如图I所爪),作为状态管理

皇Ii什和存储服务的基础被用十血多

的咂马逊的系统中“

对j’c…91.Amazun.淘宜这样的

u联网企、№,缚u『饵到都存咒敏们Ⅲ

一fI:使朋Ef¨提供的’f_联网服务遮

衅服务带束的垃大时的数据靠吐艟.

n二州一时Hl仆艇的会秆成rI万的

畦接埘数挣;库进行操作仵谜种情

况下.单台服务器或者几台服务器远

远不能满足这些数据的处理需求,单

靠提升服务器性也已经改变不了浚

情况.所以唯一可以采用的办法就是

扩展服务器的规模..服务器规模扩

展通常有两种方法:一种是仍然采用

关系型数据库.然后通过时数据库的

垂直和水平切割将整个数据库部署

到一个集群-,这种^法的优点在丁

可以采用彗十咒系型数据库(RDBMS)

的挫术,f}1缺点在于它是针时特定庙

朋,实施非常剐难:另外刺t方法就

是Google和Amazon所采用的方法,抛

卉冀系型数据库.采用‰vvJuc形

式的存储.这样可以极人地增强系统

的I,f扩展性事实I-.摹f

KeyValue的分布式缓存就是ftl于

‰r’Elf-的BigTahhJ|,Aragon的Dynamo

以及Faf曲诎的Cassandra等相关沧

文的发表而慢慢进人人们的视野,这

些H联网恒n分市式缓存上的成

功实践也使之成为r云1l-锋的核心

技术”。

缓仃服靠器集群采¨{尤t架构

圈墨蹈可38,zome月”8nMⅫ201一m·

所有服务嚣竹点地位究全一致,互利

之间采用阿状的垒连接方式,应川

通过调用分布式缓存提供的AP[zf

数据进行透明访问.无需关心敷蔷《在

后端服务节点的分布情况数据在

集群各节点均匀分柑,集群数据立c理

能力随集群中节点数量的扩亢早线

性增长。集群通过数据的多副本机

制能够提高系统的可用性,某几台服

务节点的宕机对应用的数据访川没

有任何影响。服务器节点能够根据

应用的需求灵活配置数据是古持久

化存储。

分布式缓存例时提供操作控制

台,能够登录到任何一个服务节点井

对集群的成员关系访问负荷数姑

分市进行监控和配置.同时通过操作

维护台可以完成分布式缓存集群软

件版本的安装、升级和配置。H莳分

布式缓存提供基于命令行(telnet髓

录)和罄于B/S的图形化运缝方式

分相式缓存系统的具体部署如图2

所示。

分布式缓存为应用程序提供了

客户端程序库“及若I数据服务

点组成的服务集群,客户端通过和数

姑服务节点通信形成可HJ服务器列

表,井将应用程序提交的存取请求通

过路由算法映射到一个确定的数据

服务节点上,且休的功能架构如罔3

中所示.

数据服务廿点主要分成3个憎

次:通信支撑膳、数据处理屡和数槲

存取垃

·通情支撑雎主要砸责通信怫

议适配,根据数据处殚崖一}|路巾链f!;}

管理模蚨的指示进{j端¨的愤Ⅲ:阳

t动建链同时完成底从通信数槲乜

的拉送和接收

·数据处理层包括路I“链路锻

Ho性块访问拄制处理模蚨“灶数州

迁移控制模堍

·数据存储层提供内存H_1),艇

艇介质的.级仃储管理.儿体r】『¨性

万方数据

ZTE

云计算分布式缓存技术及其在物联网中的应

圉2分布式缓存部署圈

据应用的要求进行不同的配置。内

存管理关注山存分配的效率以灶如

何避免内存碎片的形成,并根据数据

访问频度进行最近最少使用算法

ILRU)控制。SSD和硬盘存储模式在

保证访问性能的同时提供数据的持

久化存储.在这两种存储模式下数据

水会随若服务竹点重新麂动而丢

失.数据存储层提供数据生存期管

理机制.能够自动清理过期数据。

L。jr_。_.。,。

分布式缓存在保证数据访问¨f

靠性,最终一致性的同时对应用提供

高存吐、低时延的访『uJ服务.湎过增

由¨数据服务节点即能实现处理能力

的性能护充,扩容过程对应用防M完

全透叫。下面对分布式缓仃涉驶的

置健技术进行介绍。

仆布式缓存通过多副本机制寅

现牧批访问的可靠性.旧时多个剐本

之ljJn勺数据同步义会带来性能和一

敛¨{的词题我们采用NRW多副本

技术米像证数据在叮稚性、离悱能沂

川}』段最终一致性之IhJ取得平衡,

图4是NRW机制的示意幽,其中

Ⅳ是一个数据的副本数.月代表一次

成功的读取操作中最小参与节点数

量,Ⅳ代表一次成功的写操作巾蛀小

参与节点数毋。当分柑式缓存的访

问模型满足mW>Nfl.f就能保汪数据

访问的町靠性和致性。

R和∥直接影响性能、可用性和

一致性。如果Ⅳ设置为1.则分市

式缓存集群中只要有一个节点可用,

就不会影响写操作;如果R设置为

I,则分布式缓存集群中只要有一个

节点可用.就不会影响读请求。但显

而易见月和矿值过小都会时影响数

据访问的性能和可用性,为兼顾性

能、可用性和一致性,这两个值一定

要合理设置。

232敏悄Hash和虚H^

一致性H越b需要首先求出分布

式缓存数据服务器(节点)的哈希值,

并将其配置到0~232的圆上,用同

样的方法求出存储数据的键的哈希

值,井映射到圆上。然后从数据映射

到的位噩开始顺时针查找,将效据保

存到找到的第一个服务器上。如果

超过232仍然找不到服务器.就台{!ll

存到第一台缓存数据服务器}。

凼为数据节电服务器的机型并

不统一,其性能和容量是不问的.可

以使一个物理节点负责多个HhK

问的处理,使高端机器能够被充分利

用。在出现热隧时,可以将过热的

linch区问以虚_I£【节点的斤式放在负

荷较低的物理节点k

分布式缓存平台结合了豉性

Hash和虚拟节点的特点并加以改进,

圄3分布式缓存功能桨构

面面再而ii—;-4ei素i;五百、39飞露曰墨I墨万方数据

LZTETECHNOLOGVJOURNAL,、l垦团l云计算分布式缓存技术殛其在物联网中的应用

圄4NRW机制示意图

形成r如罔5的方案:将232的Hash

空间等分为若干分片.每十分片即是

一个虚竹点,根据各物理节点性能差

异配置处理不同数齄的虚节点.这些

虚甘点在物理节点卜的部署关系即

形成虚节点的蹄由。

通过一致性llmsh和虚节点相结

台的方式.实现r数据在集群的均匀

分布.嗣时也实现r数据服务器常点

热瓿的消除

路由是{j千分布式缓存集群中虚

廿点在数据舭眷节点上的分柑晴

况。分布式缓存平台构建了一个分

n,式锁同步系统米仃放全局路南表

这张路山表是分佰缓存集群路山管

理的毖准表,路南坐更时必须要前先

修改这张路由表中对应的路山记采

为避免每次路由存找揶需要蠢

瑚分市式锁服务.粹数据服务节点在

本地川时存储仝局路由表.路由古找

时c4直接稚本地进{r这样带来的

一个问越是本地路由记采町能已经

过期.因此n蹄m记录巾增加修改时

刊龇米进行路由记采版本的控制,举

例【兑叫:

…I笫10号雕竹点的路由信息

是:存^:3个副本,依次存艘n:服务

岢点A、B、Cr饿条路由信息☆:集

群巾所有节电车地都订存储

(2)A节点发隹战障宕机.在A宕

机期间,操作员对10号虚节点的蹄

由记录进行r手T:渊恪:仍然是3个

副本.依次存放在服务器前点A、D,

c上,集群中除A竹点外都完成r水

地路由记录的更新,

f3l此后A恢复r眼舟,A节点奉

地10号虚节点的路“¨d录成为一个

过期的记求.当A节点收到落在10

号虚节点上的数据读写漪求时,就会

对B.c节点的副水进行访问,访问时

会带上本地lO号路南记录的时州

戳,13、c竹点收到访问请求后台市即

通知A蹄南信息已经过期,通过这样

的路山变换机制.A快速地完成丁本

地路}Il记录更新

【.述例子中路山交换是通垃数

姑沂同请求被动触发,侧时集群中每

个节点的路由骨理模块乜台定时启

口墨蚕囝可40,201-;晶—幕_7i亩i

图5

分布式缓存的Hash

分片

动路由变换+通过这种类似痫博传染

式的智能路由交换,蹄由变更能往集

群所有节点中快速生效。客J、端API

的路由记录也采用同样的方式:窨p

端API本地缓存路由信息表,在数据

访问的同时完成和服务节点的路由

空换,大大提高了路山查找的效率

降低r数据访问的时延。

l:tI’|

分布式缓存将节点分成两类种

于节点和普通节点。

种子前点是系统配置时,需要预

先从所有节点中选出若下个节点.它

们的职竟是指挥系统的链路建立和

拆除等

普通节点稿动后.根据配置向种

子节点E曲建链,种子节点对连接l

的营通节点进行统管理.根据一定

的麒则比如按照lP数值的太小,通知

普通廿电完成互丰盯之削的建链.种r

节点札相之问也根据这个原则完成

埘州之削的连接。图6描述集群成

员关系建市的过程。

(1)升m式缓存!g前存甘点l2

3、5共4个节点,柑H之川两两存计

链路,竹点I2足种子竹点,常点¨

35是普通节点

(2)占通廿点4新加^缓存集群,

它首先根据配置t动连接种子竹点J

和竹点2

(3)种子节点1发现鼍前盯普通

节点0、3、5和它建立r链路.当普通

节点4连接成功后.E桃据节点大小



万方数据

原则指挥节点4连接普通节点0和

3,同时指挥原有普通节点5连接节

点4。

分布式缓存通过上述机制维护

集群中节点的成员关系,最终在各节

点间形成网状的全连接模型,两两之

间具备通信链路,任何节点故障和恢

复都能够快速被集群中其他节点检

测到。

3分布式缓存助力物联网

平台云化

3.1分布式缓存的优势和解决的问题

分布式缓存具有明显的技术优

势。分布式的架构从架构上保证了

良好的扩展性,当性能不够时,可以

轻松地通过添加新节点的方法扩展

性能;因为良好的扩展性,所以分布

式缓存的容量可以随着节点规模的

增大而呈线性增加,容量不会成为系

统的瓶颈;分布式缓存采用的是基于

Key—Value的简单存储方式,缓存的

架构和以内存为基础的访问方式使

得分布式缓存性能非常高,单节点每

秒可以达到24万多次的读写操作;

分布式缓存所使用的多份副本复制

的方法,避免单点故障;同时无中心

化的架构和一致性Hash的数据分布

算法,使得局部节点的损坏不会影响

整体集群的可用性,把故障的影响降

到最低。

目前的应用在部署运行过程中

常会遇到一些问题:第一,单节点不

能满足性能要求时,需要扩展到多个

节点,通常采用按号段的方式进行扩

展,此种扩展方式不具有通用性,与

各个应用密切相关,开发和维护的成

本也较高;第二,在不同的物理节点

的应用上共享数据,通常通过文件的

方式或同步的方式进行共享,但是这

在性能和一致性的处理上存在较大

的风险和困难;第三,因为多个节点

同时访问数据库,使得数据库和磁盘

I/O成为系统的瓶颈,通常使用单节

点的缓存方式来解决,这样一方面会

ZTE

云计算分布式缓存技术及其在物联网中的应

▲图6分布缓存集群成员关系

造成系统资源的浪费,另一方面也使

各个节点中缓存一致性的处理也非

常复杂;第四,应用节点的应用程序

意外退出重启动后,如何保证已有的

会话不掉线,往往通过写文件的方法

实现,这时磁盘I/O以及系统初次的

加载都存在性能瓶颈。把分布式缓

存引进应用后,可以方便地帮助应用

解决这些问题。应用通过调用分布

式缓存提供的API接口,把关键的数

据放到分布式缓存中,而自身重点关

注应用逻辑的处理,这样可以轻松打

造出高性能的、可扩展的、高可靠的

分布式应用系统,通过标准接口的封

装,对外提供云服务。

3.2分布式缓存在物联网中的应用

物联网的出现是信息通信技术

(Icn的新挑战。物联网无所不在,它

可以使所有的物体,从洗衣机到冰

箱、从房屋到汽车通过物联网进行信

息交换。物联网技术融入了射频识

别(RFID)技术、传感器技术、纳米技

术、智能技术与嵌入技术。物联网技

术将是改变人们生活和工作方式的

重要技术。物联网主要包括3个层

次,如图7中所示。第1个层次是传

感器网络,也就是目前所说的包括

RFID、条形码、传感器等设备在内的

传感网,主要用于信息的识别和采

集;第2个层次是信息传输网络,主

要用于远距离无缝传输来自传感网

所采集的巨量数据信息;第3个层次

是信息应用网络,该网络主要通过数

据处理及解决方案来提供人们所需

要的信息服务。

物联网业务网关属于第3个层

次,如图8所示。它是实现物联网应

用和物联网终端智能连接的桥梁,能

够提供接入认证、智能路由、业务计

费、能力接入、服务质量(QoS)服务保

障等核心功能。支持通用分组无线

业务(GPRS)、短信、有线接入等多种

网络接入方式。物联网业务网关汇

聚所有的机器到机器(M2M)终端消

息,除了支持标准协议终端的消息处

理外,对非标准协议终端也提供IP层

路由转发和业务鉴权功能。因此对

业务网关相关的性能提出了极高的

要求。

中兴通讯物联网业务网关采用

多模块架构,通过引入云计算分布式

缓存平台,使其具有极高的吞吐率,

保证了网关的高并发处理能力,系统

在两个刀片机框满配置的情况下,可

达到18万条/秒的报文转发速率。分

画面再丽瓦玎丽面再而丽41飞墨圈万方数据

分布式缓存技术及其在物联网中的应用

图7物联网层次结构

b翩魄瑚黼.一{呼茹荀釜日

FFF固圈固j高函毒。蔗

7Ⅻ机+盛#%机gmn∞ngⅫm

:布ig々:女作维护衄镕女#※‰:Ⅱ务H镕g

图8物联网业务网美

布式缓存的血刷.使系统支持数据动

态i王移,在个别甘点故障吓全造成事

务的巾断

一。,。,

物联网与云计茸存在荷密I=『i=町

分的关系一方面.物联网的发展离

小”云计算的主撑:帆世l。肴.物联

网将使斤J数越醵人的f々感器f如数“

亿万汁的RFID,智能尘埃和税额监

控等),采集到的数据世惊凡这此

致擀需要通主=上尤线传甚阿、宽带t联

阿m某衅存储和处理醴施虻聚,而使

甩d“掉分m式缓存等系列技术米

匠载选衅{E务具有非常辑著的性价

比优势;从质上行,使用ii{算系列

技术对这此数据进fj处理升析挖

捌.町“蜓自Il世速.准确坩能地对物

窿匿E躅萝42五忑ii"#%一MAug.20llvdl7NO.4

理ln界进{i管理和控制,使人燮”f以

更JJⅡ及时精细地管_哩物匝I}界从

而逃到“钾慧”的状态,^幅提高资源

利片{率和祉全牛产力水平”,nf“再

出,zi计算托借其强大的处删能,J,

仃储能力和极岛的性能价饼比.报自

然就会成为物联网的后白土撑、F

台粥一打衙.随着物联网针对钾徙

变通、钾能隈疗、智能电同等领域斛

陕方案的落地,物联网将成为五计算

蛙大的用户为云汁算系列技术取褂

型大商、lk成功奠定基石.

{1liU鹛i”§【MJlc§自}IⅡ&№≈2010

12J%%!∞&∞B目∞P±5月lJr#n

&目2010(12】’3

13】DECANDIAGHASTORUNDJAMPANIMel

aIDv…0Am3zon’sHighlyAvallable

Key—VBIue$IorelCI//Pr。ceedingsoflhe21.n

ACMSIGOPSSvml)osium0nOperatJng

SvstemsPrinciples(SOSP’07)O卅1417

2007WashingtonDCUSANewYorkNY

USAACM2007206—220

14JCHANGFDEANJGHEMAwA-Setal

Ba口bjeA[istribuledSco…Syslemfor

StructufedDa∞ICI//ProceedingsofIhe20¨’

ACM$1GOPSSymposiumonOperaling

SystemsPrinciplesfSOSP’05)O…2326

2005BrightonUKNewYorkNYUSA

ACM2005:205—218

【5lLAKSHMANAMAUKPcassandraA

Decentralize0StrucluredStorageSystem[J】

S1GOPs00erarln口SystemsReview201044

f21=3540

㈣S嘲&∞※Ⅻ自Ⅱ月j“E&目Ⅱ…∞&口Bt

^¥々H旧#}4{Ⅲ)201022{5)j526—531

¥e研£总I,自自讯&

$}g委员舍《员,%6M

$目婀和gⅢn务∞m&

设”I.目目±}从$i

肢Ⅱ务$自、IMSⅡ务。

■壤Ⅱ.十A∞讯w务女R

R副院K、n目&${gi

员鲁业务组组K.£月M$

§换帆目目能目%R拦、曲

为SDP、F2P、Ⅱ务目。¥、3G

“务目Icr%.彗;m日i

n$Ⅲ口§&&§∞&^

目.&&a$月∞ⅡgC_。壁^~.泌

万方数据

云计算分布式缓存技术及其在物联网中的应用

作者:高洪,董振江,GAOHong,DONGZhenjiang

作者单位:中兴通讯股份有限公司业务研究院,江苏,南京,210012

刊名:中兴通讯技术

英文刊名:ZTECOMMUNICATIONS

年,卷(期):2011,17(4)

被引用次数:1次



参考文献(6条)

1.刘鹏云计算2010

2.陈明;王锁柱物联网的产生与发展[期刊论文]-计算机教育2010(12)

3.DECANDIAG;HASTORUND;JAMPANIMDynamo:Amazon''sHighlyAvailableKey-ValueStore[Cl2007

4.CHANGF;DEANJ;GHEMAWATSBigtable:ADistributedStorageSystemforStructuredData[C)2005

5.LAKSHMANA;MALIKPCassandra:ADecentralizedStructuredStorageSystem[外文期刊]2010(02)

6.邬贺铨物联网的应用与挑战综述[期刊论文]-重庆邮电大学学报(自然科学版)2010(05)



本文读者也读过(2条)

1.吴卫峰云计算与物联网结合在福州大学应用探析[期刊论文]-福建电脑2011,27(10)

2.王艺.WangYi云计算在物联网中的应用模式浅析[期刊论文]-电信科学2011,27(12)



引证文献(2条)

1.郭唐宝.张延园.林奕一种面向应用服务器的分布式缓存机制[期刊论文]-科学技术与工程2011(36)

2.罗鉴.宋晓丽无损以太网关键技术研究[期刊论文]-中兴通讯技术2012(4)





本文链接:http://d.g.wanfangdata.com.cn/Periodical_zxtxjs201104010.aspx

献花(0)
+1
(本文系文山书院首藏)