理解linux内核的软中断（下）

mzsm 2015-05-06

展开全文

回顾

先回顾一下我们在上部分讲的激活时机，还需要再加上一个比较重要的激活时机是local_bh_enable时：

if (unlikely(!in_interrupt() && local_softirq_pending()))

do_softirq();

想想，如果异常和软中断有共享数据的话，异常处理走到此共享数据的临界区时需要关软中断，但不需要关硬中断。那么当走完临界区时，需要开软中断，此时就是一个激活时机（看preempt_count了，其实可能也是一个抢占时机）。

用“激活”而不是“调用”的原因是外围处理仅修改本cpu的__softirq_pending位图，最后由核心机制（比如ksoftirqd、能通过in_interrupt检查的软中断处理）真正处理，而这就是软中断的理念：让硬中断（或者其它）更快执行，所以不会采用直接调用的方式。

“激活”的原则是谁激活，谁处理，哪个cpu上的硬中断带来的软中断就由哪个cpu处理（或者说，归属cpu是软中断跟着硬中断走）。这样，充分发挥smp的优势，均衡到各个cpu上。至于硬中断和cpu之间的关系，我们以后讲到硬中断时再讨论。每个cpu维护自己的软中断机制就行了，各个cpu是互不相关的。注意，还是有相关性的：各个cpu并行处理同一类型的软中断时，该类型软中断处理需要为共享数据做保护，这是软中断可重入性需要付出的代价。

我们（计算机学习微信公众号：jsj_xx）下部分，接着讲软中断的核心机制相关函数：do_softirq以及__do_softirq。

软中断核心函数处理之do_softirq

do_softirq先检查软中断重入条件：必须不在硬中断里并且不在软中断里，符合条件之后就可以开始做如下的软中断处理了：

pending = local_softirq_pending();

if (pending)

__do_softirq();

这个处理是在关中断的保护下完成的，毕竟软中断和硬中断本质上是一样的，都是中断体系的（当然，进入到硬/软中断内部再开则另当别论了）。也可以看到，局部变量pending没有传入__do_softirq内部，所以此处仅是判断，不是使用，此处判断值和内部使用值可能有差异，位图中置位位数会少一些。

我们再深究一下这个检查条件。我们（计算机学习微信公众号：jsj_xx）的理解是：

这个条件达到了两个效果：同一个cpu上的软中断不嵌套；嵌套硬中断中不处理软中断。就同一个cpu而言，__do_softirq函数的执行是串行的，非重入的（do_softirq函数可以说是可重入的）；就多个cpu而言，__do_softirq函数是可重入的，即使是同一个类型的软中断。也就是说，软中断通过这个检查条件做到了本cpu上的软中断处理串行化，当然，多cpu之间的还是并行的，所以同一类型软中断处理还是需要保护自己的相关共享数据结构的。

软中断核心函数处理之__do_softirq

__do_softirq函数处理是尽量（虽然可能还是执行不完）执行所有被激活的软中断（由本cpu上的__softirq_pending位图标识）处理。我们分三个阶段分析。

准备处理阶段：关闭软中断（效果是让上面提到的检查条件为真，从而达到禁止本cpu上的软中断嵌套的目的）。

核心处理阶段：关硬中断，获得本cpu的__softirq_pending位图并存储起来，清空位图，开硬中断（仅在读写位图时需要关硬中断，防止其它硬中断同时操作）。执行本cpu的所有软中断（由存储起来的位图获得）。这个核心处理是个循环，最多10次（MAX_SOFTIRQ_RESTART），毕竟此时用的是用户进程的栈，不能借用太久。退出循环的条件是：总时间超出或者被抢占（开中断就会有被抢占）或者达到10次了。

结尾处理阶段：关硬中断，开软中断。

另外，如果10次循环都解决不完软中断，说明期间发生的硬中断很多，带来的额外的软中断也很多。那么就不继续影响借用的用户进程栈了，直接交给专门的ksoftirqd内核线程处理。这也就说明了循环的含义：处理软中断期间时还会进入新的硬中断，从而带进新的软中断（当然，仅仅是在本cpu的__softirq_pending上置位，不会有实际处理），所以需要反复去处理（处理的目标很明确，就是要清空本cpu上的__softirq_pending位图）。

再看看那个防止软中断嵌套的流程。关软中断中肯定有一句原子地加1的关键语句，如果当前内核路径A在该原子操作之前被另一个内核路径B打断，则B执行完硬中断和软中断后，返回到A的此处，A接着执行该原子操作，之后的软中断处理应该是空转，因为肯定已经被B处理完了。如果在该原子操作之后被B打断，则B执行完硬中断，不会执行自己的软中断而是会直接退出（因为软中断嵌套了），返回到A的此处，A接着执行，这次A除了处理自己软中断，还会额外地处理B的软中断。

对于preempt_count中的软中断位，由上述可以知道，它的作用有两个：防止软中断在单cpu上嵌套；保证了在执行软中断期间不被抢占。

最后，还得重复一句：这里讲的__do_softirq函数都是在一个cpu上的处理，多个cpu上的并行是不受任何控制的。

总结

关于中断的时序貌似很复杂，但其实都逃不过两个原则：硬中断会打断硬中断（当然是不同类型的）；硬中断会打断软中断（同样地：软中断不会打断硬中断，软中断也不会打断软中断）。所有貌似复杂的时序其实都只是这两个的叠加而已。

关注我们（计算机学习微信公众号：jsj_xx），原创技术文章，感悟计算机，透彻理解计算机！

【计算机学习微信公众号：jsj_xx】