使用Akka持久化——持久化与快照
前言
对于Javaweb而言,一个用户的HTTP请求最终会转换为一条Java线程处理。HTTP本身是无状态的,具体的请求逻辑一般也是无状态的。如果进程奔溃或者系统宕机,用户会发觉当前网页不可用之类的错误。虽然会影响一些用户体验,但是只要服务重启了,用户依然可以完成他的请求并满足其需要。但是有些情况下则势必会造成混乱甚至恐慌,例如跨行转账。用户从自己A银行的账户转账1万元至自己在B银行的账户,如果转出的动作成功了,但是转入却失败了,用户的心情是可想而知的,自己的财产不翼而飞了!一种解决的方式是引入事务,在此场景下还必须是分布式事务。如果只是银行内部实现分布式事务多少还是可行的,但是不同银行之间要实现的成本是可想而知的,甚至不可行的。如果A银行转出时对用户的状态作持久化,B银行对收到的转入请求也进行持久化,那么恢复用户的损失才有可能。
以上啰里啰嗦说了这么多,无非就是抛出个引子,进而介绍Akka提供的持久化功能。
Akka的持久化架构
UntypedPersistentActor:是一个持久化、有状态的Actor。它能够将将事件持久化到日志并且以线程安全的方式重新执行这些事件。它能够被用于实现命令和事件源的Actor。当一个集成了UntypedPersistentActor的Actor启动或者重启时,日志化的消息被重新发送给此Actor,以便于通过这些消息回复内部状态。
UntypedPersistentView:视图是一个持久化、有状态的Actor,它接收由另一个持久化Actor写入日志的消息。视图本身不会日志化新的消息,它仅仅从一个持久化Actor的复制消息流来更新内部状态。
UntypedPersistentActorAtLeastOnceDelivery:用于实现向目标至少发送一次消息的语义,也适用于发送者和接收者的JVM进程奔溃。
AsyncWriteJournal:异步存储发送给持久化Actor的消息序列的日志。应用程序能够通过持久化Actor控制哪个消息被日志化,哪个消息不用被日志化。日志为每条消息维护一个不断增加的序列号。日志存储的底层实现是可插拔的。Akka的持久化扩展自带一个叫做"leveldb",向本地文件系统写入的日志插件。Akka社区里还有更多日志存储插件提供。
Snapshotstore:快照存储对持久化Actor或持久化视图的内部状态的快照进行持久化。快照用于优化回复的时间。快照存储的底层是可插拔的。Akka持久化扩展自带一个向本地文件系统写入的“本地”快照存储插件。Akka社区里还有更多快照存储插件提供。
本文基于Akka官网提供的持久化例子,并对其进行一些适应性改造,将着重介绍UntypedPersistentActor、AsyncWriteJournal及Snapshotstore的应用。
配置
有关Akka的日志持久化和快照持久化的配置如下:
[plain]viewplaincopy
persistence{
journal{
plugin="akka.persistence.journal.leveldb"
leveldb.dir="target/example/journal"
leveldb.native=false
}
snapshot-store{
plugin="akka.persistence.snapshot-store.local"
local.dir="target/example/snapshots"
}
}
根据配置,我们知道日志插件使用了leveldb,leveldb的存储目录为当前项目编译路径下的example/journal路径下。快照插件使用了local,存储路径与前者相同。
持久化Actor的例子
消息与状态
本例子中需要用到Cmd和Evt两种消息,Cmd代表命令,Evt代表事件。ExampleState代表我们例子中的状态。以上三个类的定义如下:
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
publicinterfacePersistence{
publicstaticclassCmdimplementsSerializable{
privatestaticfinallongserialVersionUID=1L;
privatefinalStringdata;
publicCmd(Stringdata){
this.data=data;
}
publicStringgetData(){
returndata;
}
}
publicstaticclassEvtimplementsSerializable{
privatestaticfinallongserialVersionUID=1L;
privatefinalStringdata;
publicEvt(Stringdata){
this.data=data;
}
publicStringgetData(){
returndata;
}
}
publicstaticclassExampleStateimplementsSerializable{
privatestaticfinallongserialVersionUID=1L;
privatefinalArrayListevents;
publicExampleState(){
this(newArrayList());
}
publicExampleState(ArrayListevents){
this.events=events;
}
publicExampleStatecopy(){
returnnewExampleState(newArrayList(events));
}
publicvoidupdate(Evtevt){
events.add(evt.getData());
}
publicintsize(){
returnevents.size();
}
@Override
publicStringtoString(){
returnevents.toString();
}
}
}
上面代码展示的Cmd和Evt都很简单,它们有一样的data字段作为内容。ExampleState中维护了一个列表,次列表用于缓存所有的事件内容。
持久化Actor的实现
在具体介绍本例中持久化Actor之前,先看看其实现,其代码清单如下:
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
@Named("ExamplePersistentActor")
@Scope("prototype")
publicclassExamplePersistentActorextendsUntypedPersistentActor{
LoggingAdapterlog=Logging.getLogger(getContext().system(),this);
@Override
publicStringpersistenceId(){
return"sample-id-1";
}
privateExampleStatestate=newExampleState();
publicintgetNumEvents(){
returnstate.size();
}
@Override
publicvoidonReceiveRecover(Objectmsg){
if(msginstanceofEvt){
state.update((Evt)msg);
}elseif(msginstanceofSnapshotOffer){
state=(ExampleState)((SnapshotOffer)msg).snapshot();
}else{
unhandled(msg);
}
}
@Override
publicvoidonReceiveCommand(Objectmsg){
if(msginstanceofCmd){
finalStringdata=((Cmd)msg).getData();
finalEvtevt1=newEvt(data+"-"+getNumEvents());
finalEvtevt2=newEvt(data+"-"+(getNumEvents()+1));
persistAll(Arrays.asList(evt1,evt2),newProcedure(){
publicvoidapply(Evtevt)throwsException{
state.update(evt);
if(evt.equals(evt2)){
getContext().system().eventStream().publish(evt);
}
}
});
}elseif(msg.equals("snap")){
//IMPORTANT:createacopyofsnapshot
//becauseExampleStateismutable!!!
saveSnapshot(state.copy());
}elseif(msg.equals("print")){
log.info(state.toString());
}else{
unhandled(msg);
}
}
}
ExamplePersistentActor继承了UntypedPersistentActor,并覆盖实现了三个方法:
persistenceId:持久化Actor必须有一个标识符,此标识符必须通过persistenceId方法定义;
onReceiveRecover:此方法将在恢复期间被调用,并交由用户处理那些持久化的消息或者快照;
onReceiveCommand:此方法用于处理正常的消息;
根据ExamplePersistentActor的实现,我们知道onReceiveCommand方法的作用如下:
如果接收到的消息是Cmd时,则根据Cmd的data,构造两个新的Evt。例如:Cmd的data是test,那么两个Evt的内容分别是test-0,test-1。之后会调用UntypedPersistentActor提供的持久化方法persistAll,对两个生成的Evt持久化。最后,当持久化完成时会回调匿名内部类Procedure的apply方法将连个Evt按序更新到ExampleState中。
如果接收到的消息是snap,那么复制ExampleState中的缓存并调用UntypedPersistentActor提供的方法saveSnapshot生成快照。
如果接收到的消息是print,那么打印输出ExampleState中的缓存内容。
运行与验证
消息持久化验证
我们先使用一段代码向持久化Actor连续发送三个Cmd,内容分别是foo、baz、bar,最后再发送一条print消息,代码如下:
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
finalActorRefpersistentActor=
actorSystem.actorOf(springExt.props("ExamplePersistentActor"),"examplePersistentActor");
persistentActor.tell(newCmd("foo"),null);
persistentActor.tell(newCmd("baz"),null);
persistentActor.tell(newCmd("bar"),null);
Persistewww.baiyuewang.netntActor.tell("print",null);
运行以上代码的结果如图1所示:
图1
这说明当前的程序逻辑准确无误。下面我们开始验证消息持久化的功效了。
我们将上述代码修改为代码清单1所示。
代码清单1
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
finalActorRefpersistentActor=
actorSystem.actorOf(springExt.props("ExamplePersistentActor"),"examplePersistentActor");
persistentActor.tell("print",null);
也就是只打印状态,再次运行,输出与图1一模一样。这是因为默认情况下,持久化Actor在启动或者重启的时候会“重播”日志化的消息。这些“重播”的消息被onReceiveRecover处理后,重新更新到ExampleState的缓存中了。
最后,将上述代码修改为代码清单2所示。
代码清单2
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
finalActorRefpersistentActor=
actorSystem.actorOf(springExt.props("ExamplePersistentActor"),"examplePersistentActor");
persistentActor.tell(newCmd("buzz"),null);
persistentActor.tell("print",null);
可以看到持久化的消息依然被“重播”,并且新打印出了我们最新发送的内容为buzz的Cmd。这些消息依然被有序的放入ExampleState的缓存。这是由于在恢复期间,新发送给持久化Actor的不会干扰到“重播”的消息,新的消息将被缓存直到恢复阶段完成之后再由持久化Actor接收。
持久化时间考量与快照
上面的例子我们只发送了4个Cmd消息,并对其恢复。一般而言这不会有什么问题,但是当系统中的消息频率很高时,那么通过一条一条消息“重播”的方式显然是低效的,假如应用本身能够每隔一段时间利用快照存储,会极大地缩短恢复过程所需要的时间。
我们对上面的例子先进行一些修改,加入快照的生成:
[java]viewplaincopy在CODE上查看代码片派生到我的代码片
finalActorRefpersistentActor=
actorSystem.actorOf(springExt.props("ExamplePersistentActor"),"examplePersistentActor");
persistentActor.tell(newCmd("foo"),null);
persistentActor.tell(newCmd("baz"),null);
persistentActor.tell(newCmd("bar"),null);
persistentActor.tell("snap",null);
persistentActor.tell("print",null);
输出与图1一致。我们此时如果再次执行代码清单1,效果依然与图1一致。此时如果你通过debug方式,你会发现其中的不同:之前的恢复过程会“重播”6条消息,这次只会收到一条SnapshotOffer消息,并直接从快照恢复。
我们再次执行代码清单2,其输出也仍然与图2一致。
总结
通过本文的介绍,发现使用Akka的持久化功能,类似于使用java多线程中的wait/notify,lock/unlock,将功能从语法层面解决,对程序员而言能更多地关注于自身业务。
|
|