【原】线程池详解并使用Go语言实现 Pool

小生凡一 2024-04-07 发布于福建

展开全文

写在前面

在线程池中存在几个概念：核心线程数、最大线程数、任务队列。

核心线程数指的是线程池的基本大小；也就是指worker的数量
最大线程数指的是，同一时刻线程池中线程的数量最大不能超过该值；实际上就是指task任务的数量。
任务队列是当任务较多时，线程池中线程的数量已经达到了核心线程数，这时候就是用任务队列来存储我们提交的任务。相当于缓冲作用。

与其他池化技术不同的是，线程池是基于生产者-消费者模式来实现的，任务的提交方是生产者，线程池是消费者 。当我们需要执行某个任务时，只需要把任务扔到线程池中即可。

池化技术：这里的池化和卷积的池化不一样，这里的池化技术简单点来说，就是提前保存大量的资源，以备不时之需

线程池中执行任务的流程如下图如下。

那么使用线程池可以带来一系列好处：

降低资源消耗：通过池化技术重复利用已创建的线程，降低线程创建和销毁造成的损耗。
提高响应速度：任务到达时，无需等待线程创建即可立即执行。
提高线程的可管理性：线程是稀缺资源，如果无限制创建，不仅会消耗系统资源，还会因为线程的不合理分布导致资源调度失衡，降低系统的稳定性。使用线程池可以进行统一的分配、调优和监控。
提供更多更强大的功能：线程池具备可拓展性，允许开发人员向其中增加更多的功能。

任务调度

首先检测线程池运行状态，如果不是RUNNING，则直接拒绝，线程池要保证在RUNNING的状态下执行任务。

如果 taskCount < corePoolSize，则创建并启动一个线程来执行新提交的任务。

如果 taskCount >= corePoolSize，且线程池内的阻塞队列未满，则将任务添加到该阻塞队列中。

如果workerCount >= maximumPoolSize，并且线程池内的阻塞队列已满, 则根据 拒绝策略 来处理该任务, 默认的处理方式是直接抛异常。

常见的拒绝策略有以下几种
AbortPolicy 中止策略：丢弃任务并抛出异常。
DiscardPolicy 丢弃策略：丢弃任务，但是不抛出异常。如果线程队列已满，则后续提交的任务都会被丢弃，且是静默丢弃。
DiscardOldestPolicy 弃老策略：丢弃队列最前面的任务，然后重新提交被拒绝的任务。

简单实现

定义任务Task 并定义NewTask来新建Task对象

type Task struct {
 f func() error
}

func NewTask(f func() error) *Task {
 return &Task{f: f}
}

定义 WorkPool 线程池

type WorkPool struct {
 TaskQueue chan *Task // Task队列
 workNum   int        // 协程池中最大的worker数量
 shop      chan struct{} // 停止工作标识
}

创建 WorkPool 的函数

func NewWorkPool(cap int) *WorkPool {
 if cap <= 0 {
  cap = 10
 }
 return &WorkPool{
  TaskQueue: make(chan *Task),
  workNum:   cap,
  shop:      make(chan struct{}),
 }
}

具体的协程池中的工作节点

func (p *WorkPool) worker(workId int) {
 for task := range p.TaskQueue {
  err := task.Execute()
  if err != nil {
   fmt.Println(err)
   continue
  }
  fmt.Printf(" work id %d finished \n", workId) // 打印出具体是哪个节点进行工作
 }
}

协程池启动函数

func (p *WorkPool) run() {
 // 根据work num 去创建worker工作
 for i := 0; i < p.workNum; i++ {
  go p.worker(i)
 }
 <-p.shop
}

协程池关闭函数

func (p *WorkPool) close() {
 p.shop <- struct{}{}
}

测试一下，使用定时器，每2秒进行一次投放，并且投放超过5个之后开始停止。

func TestWorkPool(t *testing.T) {
 task := NewTask(func() error {
  fmt.Print(time.Now())
  return nil
 })
 taskCount := 0
 ticker := time.NewTicker(2 * time.Second)
 p := NewWorkPool(3)
 go func(c *time.Ticker) {
  for {
   p.TaskQueue <- task
   <-c.C
   taskCount++
   if taskCount == 5 {
    p.close()
    break
   }
  }
  return
 }(ticker)
 p.run()
}

结果：可以看到结果是每两秒进行一次打印，并且worker对象都不一样。

完整代码

package gorountine_pool

import (
 "fmt"
 "testing"
 "time"
)

func TestWorkPool(t *testing.T) {
 task := NewTask(func() error {
  fmt.Print(time.Now())
  return nil
 })
 taskCount := 0
 ticker := time.NewTicker(2 * time.Second)
 p := NewWorkPool(3)
 go func(c *time.Ticker) {
  for {
   p.TaskQueue <- task
   <-c.C
   taskCount++
   if taskCount == 5 {
    p.close()
    break
   }
  }

  return
 }(ticker)
 p.run()
}

type Task struct {
 f func() error
}

func NewTask(f func() error) *Task {
 return &Task{f: f}
}

// Execute 执行业务方法
func (t *Task) Execute() error {
 return t.f()
}

type WorkPool struct {
 TaskQueue chan *Task // task队列
 workNum   int        // 携程池中最大的worker数量
 shop      chan struct{} // 停止标识
}

// 创建Pool的函数
func NewWorkPool(cap int) *WorkPool {
 if cap <= 0 {
  cap = 10
 }
 return &WorkPool{
  TaskQueue: make(chan *Task),
  workNum:   cap,
  shop:      make(chan struct{}),
 }
}

func (p *WorkPool) worker(workId int) {
 // 具体的工作
 for task := range p.TaskQueue {
  err := task.Execute()
  if err != nil {
   fmt.Println(err)
   continue
  }
  fmt.Printf(" work id %d finished \n", workId)
 }
}

// 携程池开始工作
func (p *WorkPool) run() {
 // 根据work num 去创建worker工作
 for i := 0; i < p.workNum; i++ {
  go p.worker(i)
 }
 <-p.shop
}

func (p *WorkPool) close() {
 p.shop <- struct{}{}
}

参考链接

[1] https://tech.meituan.com/2020/04/02/java-pooling-pratice-in-meituan.html [2] https://blog.csdn.net/weixin_44688301/article/details/123292211 [3] https://www.bilibili.com/video/BV1Nf4y137na