剖析Java中阻塞队列的实现原理及应用场景
这篇文章主要介绍了剖析Java中阻塞队列的实现原理及应用场景,这里也对阻塞和非阻塞队列的不同之处进行了对比,需要的朋友可以参考下
我们平时使用的一些常见队列都是非阻塞队列,比如PriorityQueue、LinkedList(LinkedList是双向链表,它实现了Dequeue接口)。使用非阻塞队列的时候有一个很大问题就是:它不会对当前线程产生阻塞,那么在面对类似消费者-生产者的模型时,就必须额外地实现同步策略以及线程间唤醒策略,这个实现起来就非常麻烦。但是有了阻塞队列就不一样了,它会对当前线程产生阻塞,比如一个线程从一个空的阻塞队列中取元素,此时线程会被阻塞直到阻塞队列中有了元素。当队列中有元素后,被阻塞的线程会自动被唤醒(不需要我们编写代码去唤醒)。这样提供了极大的方便性。一.几种主要的阻塞队列
自从Java1.5之后,在java.util.concurrent包下提供了若干个阻塞队列,主要有以下几个:
ArrayBlockingQueue:基于数组实现的一个阻塞队列,在创建ArrayBlockingQueue对象时必须制定容量大小。并且可以指定公平性与非公平性,默认情况下为非公平的,即不保证等待时间最长的队列最优先能够访问队列。
LinkedBlockingQueue:基于链表实现的一个阻塞队列,在创建LinkedBlockingQueue对象时如果不指定容量大小,则默认大小为Integer.MAX_VALUE。
PriorityBlockingQueue:以上2种队列都是先进先出队列,而PriorityBlockingQueue却不是,它会按照元素的优先级对元素进行排序,按照优先级顺序出队,每次出队的元素都是优先级最高的元素。注意,此阻塞队列为无界阻塞队列,即容量没有上限(通过源码就可以知道,它没有容器满的信号标志),前面2种都是有界队列。
DelayQueue:基于PriorityQueue,一种延时阻塞队列,DelayQueue中的元素只有当其指定的延迟时间到了,才能够从队列中获取到该元素。DelayQueue也是一个无界队列,因此往队列中插入数据的操作(生产者)永远不会被阻塞,而只有获取数据的操作(消费者)才会被阻塞。
二.阻塞队列中的方法VS非阻塞队列中的方法
1.非阻塞队列中的几个主要方法:
add(Ee):将元素e插入到队列末尾,如果插入成功,则返回true;如果插入失败(即队列已满),则会抛出异常;
remove():移除队首元素,若移除成功,则返回true;如果移除失败(队列为空),则会抛出异常;
offer(Ee):将元素e插入到队列末尾,如果插入成功,则返回true;如果插入失败(即队列已满),则返回false;
poll():移除并获取队首元素,若成功,则返回队首元素;否则返回null;
peek():获取队首元素,若成功,则返回队首元素;否则返回null
对于非阻塞队列,一般情况下建议使用offer、poll和peek三个方法,不建议使用add和remove方法。因为使用offer、poll和peek三个方法可以通过返回值判断操作成功与否,而使用add和remove方法却不能达到这样的效果。注意,非阻塞队列中的方法都没有进行同步措施。
2.阻塞队列中的几个主要方法:
阻塞队列包括了非阻塞队列中的大部分方法,上面列举的5个方法在阻塞队列中都存在,但是要注意这5个方法在阻塞队列中都进行了同步措施。除此之外,阻塞队列提供了另外4个非常有用的方法:
put(Ee)
take()
offer(Ee,longtimeout,TimeUnitunit)
poll(longtimeout,TimeUnitunit)
put方法用来向队尾存入元素,如果队列满,则等待;
take方法用来从队首取元素,如果队列为空,则等待;
offer方法用来向队尾存入元素,如果队列满,则等待一定的时间,当时间期限达到时,如果还没有插入成功,则返回false;否则返回true;
poll方法用来从队首取元素,如果队列空,则等待一定的时间,当时间期限达到时,如果取到,则返回null;否则返回取得的元素;
三.阻塞队列的实现原理
如果队列是空的,消费者会一直等待,当生产者添加元素时候,消费者是如何知道当前队列有元素的呢?如果让你来设计阻塞队列你会如何设计,让生产者和消费者能够高效率的进行通讯呢?让我们先来看看JDK是如何实现的。
使用通知模式实现。所谓通知模式,就是当生产者往满的队列里添加元素时会阻塞住生产者,当消费者消费了一个队列中的元素后,会通知生产者当前队列可用。通过查看JDK源码发现ArrayBlockingQueue使用了Condition来实现,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40 privatefinalConditionnotFull;
privatefinalConditionnotEmpty;
publicArrayBlockingQueue(intcapacity,booleanfair){
//省略其他代码
notEmpty=lock.newCondition();
notFull=lock.newCondition();
}
publicvoidput(Ee)throwsInterruptedException{
checkNotNull(e);
finalReentrantLocklock=this.lock;
lock.lockInterruptibly();
try{
while(count==items.length)
notFull.await();
insert(e);
}finally{
lock.unlock();
}
}
publicEtake()throwsInterruptedException{
finalReentrantLocklock=this.lock;
lock.lockInterruptibly();
try{
while(count==0)
notEmpty.await();
returnextract();
}finally{
lock.unlock();
}
}
privatevoidinsert(Ex){
items[putIndex]=x;
putIndex=inc(putIndex);
++count;
notEmpty.signal();
} 当我们往队列里插入一个元素时,如果队列不可用,阻塞生产者主要通过LockSupport.park(this);来实现
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 publicfinalvoidawait()throwsInterruptedException{
if(Thread.interrupted())
thrownewInterruptedException();
Nodenode=addConditionWaiter();
intsavedState=fullyRelease(node);
intinterruptMode=0;
while(!isOnSyncQueue(node)){
LockSupport.park(this);
if((interruptMode=checkInterruptwww.hunanwang.netWhileWaiting(node))!=0)
break;
}
if(acquireQueued(node,savedState)&&interruptMode!=THROW_IE)
interruptMode=REINTERRUPT;
if(node.nextWaiter!=null)//cleanupifcancelled
unlinkCancelledWaiters();
if(interruptMode!=0)
reportInterruptAfterWait(interruptMode);
} 继续进入源码,发现调用setBlocker先保存下将要阻塞的线程,然后调用unsafe.park阻塞当前线程。
1
2
3
4
5
6 publicstaticvoidpark(Objectblocker){
Threadt=Thread.currentThread();
setBlocker(t,blocker);
unsafe.park(false,0L);
setBlocker(t,null);
} unsafe.park是个native方法,代码如下:
1 publicnativevoidpark(booleanisAbsolute,longtime); park这个方法会阻塞当前线程,只有以下四种情况中的一种发生时,该方法才会返回。
与park对应的unpark执行或已经执行时。注意:已经执行是指unpark先执行,然后再执行的park。线程被中断时。如果参数中的time不是零,等待了指定的毫秒数时。发生异常现象时。这些异常事先无法确定。我们继续看一下JVM是如何实现park方法的,park在不同的操作系统使用不同的方式实现,在linux下是使用的是系统方法pthread_cond_wait实现。实现代码在JVM源码路径src/os/linux/vm/os_linux.cpp里的os::PlatformEvent::park方法,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32 voidos::PlatformEvent::park(){
intv;
for(;;){
v=_Event;
if(Atomic::cmpxchg(v-1,&_Event,v)==v)break;
}
guarantee(v>=0,"invariant");
if(v==0){
//Dothisthehardwaybyblocking...
intstatus=pthread_mutex_lock(_mutex);
assert_status(status==0,status,"mutex_lock");
guarantee(_nParked==0,"invariant");
++_nParked;
while(_Event<0){
status=pthread_cond_wait(_cond,_mutex);
//forsomereason,under2.7lwp_cond_wait()mayreturnETIME...
//Treatthisthesameaswww.visa158.comifthewaitwasinterrupted
if(status==ETIME){status=EINTR;}
assert_status(status==0||status==EINTR,status,"cond_wait");
}
--_nParked;
//IntheorywecouldmovetheSTof0into_Eventpasttheunlock(),
//butthenwe''dneedaMEMBARaftertheST.
_Event=0;
status=pthread_mutex_unlock(_mutex);
assert_status(status==0,status,"mutex_unlock");
}
guarantee(_Event>=0,"invariant");
}
} pthread_cond_wait是一个多线程的条件变量函数,cond是condition的缩写,字面意思可以理解为线程在等待一个条件发生,这个条件是一个全局变量。这个方法接收两个参数,一个共享变量_cond,一个互斥量_mutex。而unpark方法在linux下是使用pthread_cond_signal实现的。park在windows下则是使用WaitForSingleObject实现的。
当队列满时,生产者往阻塞队列里插入一个元素,生产者线程会进入WAITING(parking)状态。我们可以使用jstackdump阻塞的生产者线程看到这点:
1
2
3
4
5
6
7
8 "main"prio=5tid=0x00007fc83c000000nid=0x10164e000waitingoncondition[0x000000010164d000]
java.lang.Thread.State:WAITING(parking)
atsun.misc.Unsafe.park(NativeMethod)
-parkingtowaitfor<0x0000000140559fe8>(ajava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
atjava.util.concurrent.locks.LockSupport.park(LockSupport.java:186)
atjava.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2043)
atjava.util.concurrent.ArrayBlockingQueue.put(ArrayBlockingQueue.java:324)
atblockingqueue.ArrayBlockingQueueTest.main(ArrayBlockingQueueTest.java:11) 四.示例和使用场景
下面先使用Object.wait()和Object.notify()、非阻塞队列实现生产者-消费者模式:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47 publicclassTest{
privateintqueueSize=10;
privatePriorityQueuequeue=newPriorityQueue(queueSize);
publicstaticvoidmain(String[]args){
Testtest=newTest();
Producerproducer=test.newProducer();
Consumerconsumer=test.newConsumer();
producer.start();
consumer.start();
}
classConsumerextendsThread{
@Override
publicvoidrun(){
consume();
}
privatevoidconsume(){
while(true){
synchronized(queue){
while(queue.size()==0){
try{
System.out.println("队列空,等待数据");
queue.wait();
}catch(InterruptedExceptione){
e.printStackTrace();
queue.notify();
}
}
queue.poll();//每次移走队首元素
queue.notify();
System.out.println("从队列取走一个元素,队列剩余"+queue.size()+"个元素");
}
}
}
}
classProducerextendsThread{
@Override
publicvoidrun(){
produce();
}
privatevoidproduce(){
while(true){
synchronized(queue){
while(queue.size()==queueSize){
try{
System.out.println("队列满,等待有空余空间");
queue.wait();
}catch(InterruptedExceptione){
e.printStackTrace();
queue.notify();
}
}
queue.offer(1);//每次插入一个元素
queue.notify();
System.out.println("向队列取中插入一个元素,队列剩余空间:"+(queueSize-queue.size()));
}
}
}
}
} 这个是经典的生产者-消费者模式,通过阻塞队列和Object.wait()和Object.notify()实现,wait()和notify()主要用来实现线程间通信。
具体的线程间通信方式(wait和notify的使用)在后续问章中会讲述到。
下面是使用阻塞队列实现的生产者-消费者模式:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35 publicclassTest{
privateintqueueSize=10;
privateArrayBlockingQueuequeue=newArrayBlockingQueue(queueSize);
publicstaticvoidmain(String[]args){
Testtest=newTest();
Producerproducer=test.newProducer();
Consumerconsumer=test.newConsumer();
producer.start();
consumer.start();
}
classConsumerextendsThread{
@Override
publicvoidrun(){
consume();
}
privatevoidconsume(){
while(true){
try{
queue.take();
System.out.println("从队列取走一个元素,队列剩余"+queue.size()+"个元素");
}catch(InterruptedExceptione){
e.printStackTrace();
}
}
}
}
classProducerextendsThread{
@Override
publicvoidrun(){
produce();
}
privatevoidproduce(){
while(true){
try{
queue.put(1);
System.out.println("向队列取中插入一个元素,队列剩余空间:"+(queueSize-queue.size()));
}catch(InterruptedExceptione){
e.printStackTrace();
}
}
}
}
} 有没有发现,使用阻塞队列代码要简单得多,不需要再单独考虑同步和线程间通信的问题。
在并发编程中,一般推荐使用阻塞队列,这样实现可以尽量地避免程序出现意外的错误。
阻塞队列使用最经典的场景就是socket客户端数据的读取和解析,读取数据的线程不断将数据放入队列,然后解析线程不断从队列取数据解析。还有其他类似的场景,只要符合生产者-消费者模型的都可以使用阻塞队列。
|
|