likes
comments
collection
share

Java线程池原理解析

作者站长头像
站长
· 阅读数 39

参考文章:juejin.cn/post/698321…

一、Java线程池的基本使用

  在Java中可以通过如下两种方式使用线程池,不过最终都是使用到ThreadPoolExecutor。

1、直接使用ThreadPoolExecutor

  可通过ThreadPoolExecutor的构造函数创建出线程池的实例对象,并调用其execute函数进行任务添加。代码实现如下:

ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(
        10,//corePoolSize
        20,//maximumPoolSize
        120,//keepAliveTime
        TimeUnit.SECONDS,//keepAliveTime时间单位
        new ArrayBlockingQueue<>(10)//等待队列
        );
//将任务添加到该线程池中
threadPoolExecutor.execute(() -> {
    //do something
});//注意这里使用时lambda表达式

  这里简单说一下lambda表达式,注意遵循如下几个原则即可,具体可参考该篇博客

1)需要函数式接口(即一个接口中只有一个函数);注意一定要是接口;
2)lambada表达式->前面的是形参,形参可省略掉参数类型;如果只有一个形参则可以省略掉括号;
3->后面的是函数体,如果只有一行代码则可省略掉大括号,如果该一行代码是返回语句则省略掉大括号的同时也需要省略掉return关键词。

2、使用Executors

  通过该类提供的函数,可以创建如下几种类型的线程池;不过其底层仍然使用的是ThreadPoolExecutor。

//该线程池只包含一个线程,所有任务顺序执行;适用于需要顺序执行任务的场景
ExecutorService singleThreadExecutor = Executors.newSingleThreadExecutor();
//创建固定线程数量线程池,即该线程池中线程数量固定,如果线程池中线程都处于忙碌状态,则新进来的任务需要进入到阻塞队列中,直到线程空闲为止。
//适用于需要限制线程数量的场景
ExecutorService fixedThreadPool = Executors.newFixedThreadPool(3);
//可缓存线程池是一个根据需要自动调整大小的线程池;适用于执行大量的短期异步任务的场景
ExecutorService cachedThreadPool = Executors.newCachedThreadPool();
//定时任务线程池,底层使用的是ScheduledThreadPoolExecutor,不过该类也继承至ThreadPoolExecutor;
//用于执行定时任务和周期性任务
ExecutorService scheduledExecutorService = Executors.newScheduledThreadPool(3);

  如下以函数newCachedThreadPool为例子,学习一下Executors创建线程池的底层实现。从其源码可以知道其也是通过ThreadPoolExecutor类创建的线程池对象,只是其中的各个参数已经定义好了而已。

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                  60L, TimeUnit.SECONDS,
                                  new SynchronousQueue<Runnable>());
}

二、ThreadPoolExecutor源码

1、ThreadPoolExecutor构造函数

/**
* corePoolSize:线程池中核心线程数量,一般来说核心线程会一直存在,即使处于空闲状态;
* maximumPoolSize:线程池中最大线程数量;当任务量超过核心线程数量并且任务队列已满,线程池还能创建新的线程来处理任务,但是线程数(包括核心线程数量)不会超过该值;
* keepAliveTime:非核心线程在空闲状态下能够存活的时间;
* unit:存活时间单位(ms、s、h等);
* workQueue:等待执行的任务列表(先进先出);
* threadFactory:线程创建工厂,可使用默认的,也可以自定义;
* handler:任务超过 maximumPoolSize+任务队列大小回调函数,即无法处理新的任务;也称拒绝策略。
*/
public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler) {
    //各个参数合法性判断
    if (corePoolSize < 0 ||
            maximumPoolSize <= 0 ||
            maximumPoolSize < corePoolSize ||
            keepAliveTime < 0)
        throw new IllegalArgumentException();
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}

2、execute函数

  通过调用该函数以提交新的任务到线程池中进行处理。因此以该函数的源码实现作为学习线程池源码的入口点。代码如下:

public void execute(Runnable command) {
    //不允许提交的任务为空
    if (command == null)
        throw new NullPointerException();
    //获取当前线程池状态+线程数量(具体可阅读开头的参考文章)
    int c = ctl.get();
    //判断当前线程数是否小于核心线程数
    if (workerCountOf(c) < corePoolSize) {
        //如果小于核心线程数则创建新的线程并直接执行
        //这里参数true表示当前需要创建的线程是核心线程(用于判断当前允许的最大线程数量)
        if (addWorker(command, true))
            return;
        //任务执行失败,则重新获取线程池状态+当前线程数
        c = ctl.get();
    }
    //首先判断线程池是否处于运行状态,如果是则将当前任务添加到任务队列中
    if (isRunning(c) && workQueue.offer(command)) {
        //重新获取线程池状态标识
        int recheck = ctl.get();
        //如果线程池没有运行,则从队列中移除该任务,并执行拒绝策略
        if (! isRunning(recheck) && remove(command))
            reject(command);
        //当前正在运行线程为0
        //则需要启动一个核心线程以运行任务队列中的任务
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    //任务队列已满,则启动非核心线程,false标识启动非核心线程
    //如果任务运行失败,则执行拒绝策略
    else if (!addWorker(command, false))
        reject(command);
}

  如上代码可缩减为如下几个步骤:

  • 判断是否能够创建核心线程以执行任务
  • 将任务添加到任务队列
  • 创建非核心线程执行任务
  • 任务执行失败则执行拒绝策略

3、addWorker函数

  该函数主要有两个功能:(1)通过CAS将当前线程数量+1;(2)创建新的线程并添加到工作队列中,同时立马开始执行当前传递进来的任务;

private boolean addWorker(Runnable firstTask, boolean core) {
    retry://类似于goto
    //获取当前线程池状态+线程数量
    for (int c = ctl.get();;) {
        //如果当前线程池状态是RUNNING则可以继续执行任务
        //否则如果当前线池状态是STOP、TIDYING或者TERMINATED或者待执行任务为空或者工作队列为空,则直接返回false
        if (runStateAtLeast(c, SHUTDOWN)
                && (runStateAtLeast(c, STOP)
                || firstTask != null
                || workQueue.isEmpty()))
            return false;
        //通过CAS将线程数量+1,直到修改成功为止
        for (;;) {
            //根据当前是否是核心线程选择当前允许的最大线程数量
            //如果超过允许的最大线程数量则直接返回false
            if (workerCountOf(c)
                    >= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK))
                return false;
            //通过CAS将线程数量+1
            if (compareAndIncrementWorkerCount(c))
                break retry;
            c = ctl.get();
            //CAS修改线程数量失败,再次判断线程池状态
            if (runStateAtLeast(c, SHUTDOWN))
                continue retry;
        }
    }

    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        //该类为ThreadPoolExecutor内部类,继承了AbstractQueuedSynchronizer类并且实现了Runnable类
        //并且在其构造函数中会调用所提供的工厂创建新的线程
        w = new Worker(firstTask);
        //获取创建的新线程
        final Thread t = w.thread;
        if (t != null) {
            //加锁
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                int c = ctl.get();
                //判断线程池是否处于运行状态或者可执行任务状态
                if (isRunning(c) ||
                        (runStateLessThan(c, STOP) && firstTask == null)) {
                    //如果线程状态不是处于新创建状态则直接抛出异常
                    if (t.getState() != Thread.State.NEW)
                        throw new IllegalThreadStateException();
                    //将新创建的worker添加到工作队列中
                    workers.add(w);
                    workerAdded = true;
                    int s = workers.size();
                    if (s > largestPoolSize)
                        largestPoolSize = s;
                }
             //释放锁
            } finally {
                mainLock.unlock();
            }
            //如果是新创建的线程则直接开始执行任务
            if (workerAdded) {
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        //没有启动新的任务或者启动失败,则将新的任务从任务队列移除,并将线程数量-1
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

3、Worker类源码

  该类比较简单,其构造函数中会存储当前需要运行的任务(可为空);并通过提供的工厂创建新的线程,同时将当前对象引用作为Runnable任务传递给该线程;当上述addWorker函数中调用t.start()就会调用到该类的run函数中以执行后续的逻辑。

private final class Worker extends AbstractQueuedSynchronizer implements Runnable {

    private static final long serialVersionUID = 6138294804551838833L;

    @SuppressWarnings("serial") // Unlikely to be serializable
    final Thread thread;

    @SuppressWarnings("serial") // Not statically typed as Serializable
            Runnable firstTask;

    volatile long completedTasks;

    Worker(Runnable firstTask) {
        setState(-1); // inhibit interrupts until runWorker
        //当前需要执行的任务
        this.firstTask = firstTask;
        //通过提供的工厂创建新的线程,注意这里将当前类的引用传递给了Thread作为Runnable任务
        this.thread = getThreadFactory().newThread(this);
    }

    public void run() {
        runWorker(this);
    }
    //省略掉部分源码
    ......
}

4、runWorker函数

  如下代码就是当前线程开始执行任务了;(1)首先判断worker是否存在需要执行的任务,如果有则优先执行该任务;(2)否则从队列中获取任务进行执行;

final void runWorker(Worker w) {
    //获取当前线程
    Thread wt = Thread.currentThread();
    //获取当前worker中需要执行的任务(优先级最高)
    Runnable task = w.firstTask;
    //将worker中需要执行任务设置为空,防止后续重复执行
    w.firstTask = null;
    w.unlock(); 
    boolean completedAbruptly = true;
    try {
        //首先判断当前worker中需要执行的任务是否为空,如果不为空则执行该任务
        //否则从任务列表中获取任务进行执行,注意getTask会阻塞当前线程
        while (task != null || (task = getTask()) != null) {
            //加锁
            w.lock();
            //判断当前线程池以及线程是否能够继续执行任务
            if ((runStateAtLeast(ctl.get(), STOP) ||
                    (Thread.interrupted() &&
                            runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                wt.interrupt();
            try {
                //该函数未实现
                beforeExecute(wt, task);
                try {
                    //执行任务
                    task.run();
                    //该函数未实现
                    afterExecute(task, null);
                } catch (Throwable ex) {
                    afterExecute(task, ex);
                    throw ex;
                }
            } finally {
                task = null;
                w.completedTasks++;
                w.unlock();
            }
        }
        completedAbruptly = false;
    } finally {
        //结束当前线程
        processWorkerExit(w, completedAbruptly);
    }
}

5、getTask函数

  在该函数中会根据是否允许超时回收线程以设置任务获取阻塞时间,如果是核心线程则会一直阻塞,非核心线程如果超时仍然没有获取到可执行任务则会被回收。

private Runnable getTask() {
    boolean timedOut = false;

    for (;;) {
        int c = ctl.get();
        //判断线程池是否处于可执行任务状态,如果不是则返回null
        //注意这里SHUTDOWN状态是可以继续执行任务的
        if (runStateAtLeast(c, SHUTDOWN)
                && (runStateAtLeast(c, STOP) || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }
        
        //获取当前线程数量
        int wc = workerCountOf(c);
        //allowCoreThreadTimeOut表示是否允许空闲的核心线程超时回收
        //或者如果当前线程数量大于核心线程数量,则超过核心线程数量的线程可以超时回收
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
        
        //如果某个线程超时获取task为null,则会执行到该处
        //注意这里修改线程数量是通过CAS,也就是同一时刻只有一个线程能够修改成功,其余线程如果同步在修改则会失败
        if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
            //通过CAS将线程数量-1,并直接返回null,即直接结束当前线程
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            //通过阻塞的方式等待队列任务
            //如果timed为true则说明可以超时回收线程,即如果在特定时间内没有新的任务,那么当前线程就需要回收
            //take函数会一直等待直到有新的任务出现需要处理
            Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}

三、总结

  如上代码分析下来,回答如下几个问题则没有什么难度了:

问题1:线程池任务处理基本流程
回答:通过execute函数将任务提交到线程池,如果核心线程数未超过则直接创建核心线程执行任务,否则添加到任务队列;
如果任务队列满了则创建非核心线程执行任务,否则执行拒绝策略。

问题2:如何复用现有线程
回答:从上述代码分析能够知道,每个线程会优先执行当前worker中的task,如果当前worker的task为空,则会去任务队列中获取任务进行执行;
如果任务队列为空则会阻塞当前线程;即典型的生产者-消费者模型,上层业务会向任务队列中添加任务(生产),线程会从任务队列中获取任务进行执行(消费),这样线程就能够不断复用了。

问题3:核心线程与非核心线程是否存在区别
回答:没有啥区别,如果当前既有核心线程也有非核心线程,那么最终被保留下来的线程就是核心线程,具体的可参考上述getTask函数源码。
转载自:https://juejin.cn/post/7255309681547706425
评论
请登录