Java线程池原理解析

站长

2023年08月07日 22:21 · 阅读数 74

参考文章：juejin.cn/post/698321…

一、Java线程池的基本使用

在Java中可以通过如下两种方式使用线程池，不过最终都是使用到ThreadPoolExecutor。

1、直接使用ThreadPoolExecutor

可通过ThreadPoolExecutor的构造函数创建出线程池的实例对象，并调用其execute函数进行任务添加。代码实现如下：

ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(
        10,//corePoolSize
        20,//maximumPoolSize
        120,//keepAliveTime
        TimeUnit.SECONDS,//keepAliveTime时间单位
        new ArrayBlockingQueue<>(10)//等待队列
        );
//将任务添加到该线程池中
threadPoolExecutor.execute(() -> {
    //do something
});//注意这里使用时lambda表达式

这里简单说一下lambda表达式，注意遵循如下几个原则即可，具体可参考该篇博客。

（1）需要函数式接口（即一个接口中只有一个函数）；注意一定要是接口；
（2）lambada表达式->前面的是形参，形参可省略掉参数类型；如果只有一个形参则可以省略掉括号；
（3）->后面的是函数体，如果只有一行代码则可省略掉大括号，如果该一行代码是返回语句则省略掉大括号的同时也需要省略掉return关键词。

2、使用Executors

通过该类提供的函数，可以创建如下几种类型的线程池；不过其底层仍然使用的是ThreadPoolExecutor。

//该线程池只包含一个线程，所有任务顺序执行；适用于需要顺序执行任务的场景
ExecutorService singleThreadExecutor = Executors.newSingleThreadExecutor();
//创建固定线程数量线程池，即该线程池中线程数量固定，如果线程池中线程都处于忙碌状态，则新进来的任务需要进入到阻塞队列中，直到线程空闲为止。
//适用于需要限制线程数量的场景
ExecutorService fixedThreadPool = Executors.newFixedThreadPool(3);
//可缓存线程池是一个根据需要自动调整大小的线程池;适用于执行大量的短期异步任务的场景
ExecutorService cachedThreadPool = Executors.newCachedThreadPool();
//定时任务线程池，底层使用的是ScheduledThreadPoolExecutor，不过该类也继承至ThreadPoolExecutor；
//用于执行定时任务和周期性任务
ExecutorService scheduledExecutorService = Executors.newScheduledThreadPool(3);

如下以函数newCachedThreadPool为例子，学习一下Executors创建线程池的底层实现。从其源码可以知道其也是通过ThreadPoolExecutor类创建的线程池对象，只是其中的各个参数已经定义好了而已。

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

二、ThreadPoolExecutor源码

1、ThreadPoolExecutor构造函数

/**
* corePoolSize：线程池中核心线程数量，一般来说核心线程会一直存在，即使处于空闲状态；
* maximumPoolSize：线程池中最大线程数量；当任务量超过核心线程数量并且任务队列已满，线程池还能创建新的线程来处理任务，但是线程数（包括核心线程数量）不会超过该值；
* keepAliveTime：非核心线程在空闲状态下能够存活的时间；
* unit：存活时间单位（ms、s、h等）；
* workQueue：等待执行的任务列表（先进先出）；
* threadFactory：线程创建工厂，可使用默认的，也可以自定义；
* handler：任务超过 maximumPoolSize+任务队列大小回调函数，即无法处理新的任务；也称拒绝策略。
*/
public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    //各个参数合法性判断
    if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
        throw new IllegalArgumentException();
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

2、execute函数

通过调用该函数以提交新的任务到线程池中进行处理。因此以该函数的源码实现作为学习线程池源码的入口点。代码如下：

public void execute(Runnable command) {
    //不允许提交的任务为空
    if (command == null)
        throw new NullPointerException();
    //获取当前线程池状态+线程数量（具体可阅读开头的参考文章）
    int c = ctl.get();
    //判断当前线程数是否小于核心线程数
    if (workerCountOf(c) < corePoolSize) {
        //如果小于核心线程数则创建新的线程并直接执行
        //这里参数true表示当前需要创建的线程是核心线程（用于判断当前允许的最大线程数量）
        if (addWorker(command, true))
            return;
        //任务执行失败，则重新获取线程池状态+当前线程数
        c = ctl.get();
    }
    //首先判断线程池是否处于运行状态，如果是则将当前任务添加到任务队列中
    if (isRunning(c) && workQueue.offer(command)) {
        //重新获取线程池状态标识
        int recheck = ctl.get();
        //如果线程池没有运行，则从队列中移除该任务，并执行拒绝策略
        if (! isRunning(recheck) && remove(command))
            reject(command);
        //当前正在运行线程为0
        //则需要启动一个核心线程以运行任务队列中的任务
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    //任务队列已满，则启动非核心线程，false标识启动非核心线程
    //如果任务运行失败，则执行拒绝策略
    else if (!addWorker(command, false))
        reject(command);
}

如上代码可缩减为如下几个步骤：

判断是否能够创建核心线程以执行任务
将任务添加到任务队列
创建非核心线程执行任务
任务执行失败则执行拒绝策略

3、addWorker函数

该函数主要有两个功能：（1）通过CAS将当前线程数量+1；（2）创建新的线程并添加到工作队列中，同时立马开始执行当前传递进来的任务；

private boolean addWorker(Runnable firstTask, boolean core) {
    retry://类似于goto
    //获取当前线程池状态+线程数量
    for (int c = ctl.get();;) {
        //如果当前线程池状态是RUNNING则可以继续执行任务
        //否则如果当前线池状态是STOP、TIDYING或者TERMINATED或者待执行任务为空或者工作队列为空，则直接返回false
        if (runStateAtLeast(c, SHUTDOWN)
                && (runStateAtLeast(c, STOP)
                || firstTask != null
                || workQueue.isEmpty()))
            return false;
        //通过CAS将线程数量+1，直到修改成功为止
        for (;;) {
            //根据当前是否是核心线程选择当前允许的最大线程数量
            //如果超过允许的最大线程数量则直接返回false
            if (workerCountOf(c)
                    >= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK))
                return false;
            //通过CAS将线程数量+1
            if (compareAndIncrementWorkerCount(c))
                break retry;
            c = ctl.get();
            //CAS修改线程数量失败，再次判断线程池状态
            if (runStateAtLeast(c, SHUTDOWN))
                continue retry;
        }
    }

    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        //该类为ThreadPoolExecutor内部类，继承了AbstractQueuedSynchronizer类并且实现了Runnable类
        //并且在其构造函数中会调用所提供的工厂创建新的线程
        w = new Worker(firstTask);
        //获取创建的新线程
        final Thread t = w.thread;
        if (t != null) {
            //加锁
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                int c = ctl.get();
                //判断线程池是否处于运行状态或者可执行任务状态
                if (isRunning(c) ||
                        (runStateLessThan(c, STOP) && firstTask == null)) {
                    //如果线程状态不是处于新创建状态则直接抛出异常
                    if (t.getState() != Thread.State.NEW)
                        throw new IllegalThreadStateException();
                    //将新创建的worker添加到工作队列中
                    workers.add(w);
                    workerAdded = true;
                    int s = workers.size();
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                }
             //释放锁
            } finally {
                mainLock.unlock();
            }
            //如果是新创建的线程则直接开始执行任务
            if (workerAdded) {
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        //没有启动新的任务或者启动失败，则将新的任务从任务队列移除，并将线程数量-1
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

3、Worker类源码

该类比较简单，其构造函数中会存储当前需要运行的任务（可为空）；并通过提供的工厂创建新的线程，同时将当前对象引用作为Runnable任务传递给该线程；当上述addWorker函数中调用t.start()就会调用到该类的run函数中以执行后续的逻辑。

private final class Worker extends AbstractQueuedSynchronizer implements Runnable {

    private static final long serialVersionUID = 6138294804551838833L;

    @SuppressWarnings("serial") // Unlikely to be serializable
    final Thread thread;

    @SuppressWarnings("serial") // Not statically typed as Serializable
            Runnable firstTask;

    volatile long completedTasks;

    Worker(Runnable firstTask) {
        setState(-1); // inhibit interrupts until runWorker
        //当前需要执行的任务
        this.firstTask = firstTask;
        //通过提供的工厂创建新的线程，注意这里将当前类的引用传递给了Thread作为Runnable任务
        this.thread = getThreadFactory().newThread(this);
    }

    public void run() {
        runWorker(this);
    }
    //省略掉部分源码
    ......
}

4、runWorker函数

如下代码就是当前线程开始执行任务了；（1）首先判断worker是否存在需要执行的任务，如果有则优先执行该任务；（2）否则从队列中获取任务进行执行；

final void runWorker(Worker w) {
    //获取当前线程
    Thread wt = Thread.currentThread();
    //获取当前worker中需要执行的任务（优先级最高）
    Runnable task = w.firstTask;
    //将worker中需要执行任务设置为空，防止后续重复执行
    w.firstTask = null;
    w.unlock(); 
    boolean completedAbruptly = true;
    try {
        //首先判断当前worker中需要执行的任务是否为空，如果不为空则执行该任务
        //否则从任务列表中获取任务进行执行，注意getTask会阻塞当前线程
        while (task != null || (task = getTask()) != null) {
            //加锁
            w.lock();
            //判断当前线程池以及线程是否能够继续执行任务
            if ((runStateAtLeast(ctl.get(), STOP) ||
                    (Thread.interrupted() &&
                            runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                wt.interrupt();
            try {
                //该函数未实现
                beforeExecute(wt, task);
                try {
                    //执行任务
                    task.run();
                    //该函数未实现
                    afterExecute(task, null);
                } catch (Throwable ex) {
                    afterExecute(task, ex);
                    throw ex;
                }
            } finally {
                task = null;
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
        //结束当前线程
        processWorkerExit(w, completedAbruptly);
    }
}

5、getTask函数

在该函数中会根据是否允许超时回收线程以设置任务获取阻塞时间，如果是核心线程则会一直阻塞，非核心线程如果超时仍然没有获取到可执行任务则会被回收。

private Runnable getTask() {
    boolean timedOut = false;

    for (;;) {
        int c = ctl.get();
        //判断线程池是否处于可执行任务状态，如果不是则返回null
        //注意这里SHUTDOWN状态是可以继续执行任务的
        if (runStateAtLeast(c, SHUTDOWN)
                && (runStateAtLeast(c, STOP) || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }
        
        //获取当前线程数量
        int wc = workerCountOf(c);
        //allowCoreThreadTimeOut表示是否允许空闲的核心线程超时回收
        //或者如果当前线程数量大于核心线程数量，则超过核心线程数量的线程可以超时回收
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
        
        //如果某个线程超时获取task为null，则会执行到该处
        //注意这里修改线程数量是通过CAS，也就是同一时刻只有一个线程能够修改成功，其余线程如果同步在修改则会失败
        if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
            //通过CAS将线程数量-1，并直接返回null，即直接结束当前线程
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            //通过阻塞的方式等待队列任务
            //如果timed为true则说明可以超时回收线程，即如果在特定时间内没有新的任务，那么当前线程就需要回收
            //take函数会一直等待直到有新的任务出现需要处理
            Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}

三、总结

如上代码分析下来，回答如下几个问题则没有什么难度了：

问题1：线程池任务处理基本流程
回答：通过execute函数将任务提交到线程池，如果核心线程数未超过则直接创建核心线程执行任务，否则添加到任务队列；
如果任务队列满了则创建非核心线程执行任务，否则执行拒绝策略。

问题2：如何复用现有线程
回答：从上述代码分析能够知道，每个线程会优先执行当前worker中的task，如果当前worker的task为空，则会去任务队列中获取任务进行执行；
如果任务队列为空则会阻塞当前线程；即典型的生产者-消费者模型，上层业务会向任务队列中添加任务（生产），线程会从任务队列中获取任务进行执行（消费），这样线程就能够不断复用了。

问题3：核心线程与非核心线程是否存在区别
回答：没有啥区别，如果当前既有核心线程也有非核心线程，那么最终被保留下来的线程就是核心线程，具体的可参考上述getTask函数源码。

转载自:https://juejin.cn/post/7255309681547706425