likes
comments
collection
share

Go 如何实现协程并发执行

作者站长头像
站长
· 阅读数 13

前言

前情回顾:

Go 了解协程

Go 深入考究协程

Go 多线程是如何运行协程的

Go 为什么要有GMP调度模型

前面我们讲解了线程是通过本地队列,全局队列或者偷其它线程的方式来获取协程的,目前看来,线程运行完一个协程后再从队列中获取下一个协程执行,还只是顺序执行协程的。

而多个线程一起这么运行也能达到并发的效果。但Go并没有采取这种方式,那这种方式存在什么问题?Go是如何解决的?

顺序执行有什么问题

很明显,顺序执行会造成协程的饥饿问题。如果某个大协程挂在线程中运行了十分钟,那么队列中其它协程就一直处于休眠中无法运行,这不公平。如果让某些实时性强的协程饥饿,得不到cpu运行,会影响业务。比如视频弹幕,用户发出一条弹幕,得尽快显示在视频中。若此时协程饥饿,得不到处理,用户体验就差了。

该如何解决呢?简单,让大协程切换出去就可以了。

协程切换

回到线程循环这张图中(在深入考究协程一文中有解释),业务方法这块即线程执行的协程。如果业务方法运行时间过长,则触发协程切换。

  • 对协程:保存该协程运行的情况,然后将该协程放入本地队列队尾,休眠该协程。
  • 对线程:从业务方法中跳出,重新执行schedule方法,之后会从本地队列中获取一个新的协程运行。

Go 如何实现协程并发执行

但这样只是本地队列的协程切换,全局队列的协程仍会饥饿,该如何解决呢?

随机抽取全局协程

在线程循环的shedulefindRunnable函数中,每隔一段时间就会从全局队列中获取一个协程放到本地队列,再通过本地队列的协程切换,使得来自全局队列的协程有机会运行,从而解决全局队列协程的饥饿问题。来看下源码:

if pp.schedtick%61 == 0 && sched.runqsize > 0 {
   lock(&sched.lock)
   gp := globrunqget(pp, 1)
   unlock(&sched.lock)
   if gp != nil {
      return gp, false, false
   }
}

pp.schedtick表示线程循环的次数,如果达到61的倍数,就执行globrunqget,从全局队列中获取协程。

协程如何并发执行

从以上可得知,线程通过切换协程的方式,不再顺序的执行协程了,从而达到并发执行协程的效果。这关键在于协程的切换,那协程在什么时候会切换呢?

协程切换时机

协程的切换时机如下:

  • 主动挂起,调用gopark函数,使协程主动休眠等待
  • 系统调用完成后,io操作耗时,因此切换协程
  • 基于协作的抢占式调度,协程在跳转到其它方法时,就把自己切换出去
  • 基于信号的抢占式调度,通过发送信号,触发线程的调度方法

主动挂起

协程可以调用runtime.gopark方法,使自己陷入休眠。

Go 如何实现协程并发执行

源码如下:

// 将当前协程置于等待状态
func gopark(unlockf func(*g, unsafe.Pointer) bool, lock unsafe.Pointer, reason waitReason, traceEv byte, traceskip int) {
   if reason != waitReasonSleep {
      checkTimeouts() // timeouts may expire while two goroutines keep the scheduler busy
   }
   mp := acquirem()
   gp := mp.curg
   status := readgstatus(gp)
   if status != _Grunning && status != _Gscanrunning {
      throw("gopark: bad g status")
   }
   mp.waitlock = lock
   mp.waitunlockf = unlockf
   gp.waitreason = reason
   mp.waittraceev = traceEv
   mp.waittraceskip = traceskip
   releasem(mp)
   // can't do anything that might move the G between Ms here.
   mcall(park_m)
}

可以看到:

  1. gopark中通过acquirem获取到当前的线程指针mp
  2. 通过mp获取到当前运行的协程指针gp
  3. 给mp,gp的一些字段赋值,修改状态
  4. 然后调用mcallmcall是一个汇编方法,作用时切换到g0栈,并执行传入的函数。这里执行park_m函数,最终跳转到schedule方法,也就是线程循环的开头,实现了协程的主动切换。
// park_m函数最终跳转到schedule
func park_m(gp *g) {
   mp := getg().m
   ...
   schedule()
}

由于gopark是小写开头的,外部无法调用。我们在使用time.Sleepsync.WaitGroup时,会间接的使用到gopark,将协程休眠。

系统调用完成后

当协程要执行读写文件、网络 IO、进程间通信等系统调用的操作时,会进入entersyscall函数,将该协程暂停并放入等待队列。

当系统调用完成后,由于io操作都比较耗时,说明该协程已经运行了挺长一段时间了,因此将协程挂起,切换另一个协程执行很合理。

Go 如何实现协程并发执行

exitsyscall也位于runtime中,源码部分如下:

func exitsyscall() {
   gp := getg()
   ...
   mcall(exitsyscall0)
   ...
}

又是熟悉的mcall,mcall执行了exitsyscall0函数,最终跳转到线程循环开头的schedule函数,完成协程切换。

基于协作的抢占式调度

如果协程既不主动挂起,也没有进行系统调用呢,那就一直切换不出去了?该怎么解决呢,如果每个协程都经常调用同一个方法的话,那就可以在这个方法里加入一个钩子,让这个协程切换出去。

思路有了,具体找哪个方法呢?这里做一个演示。

package main

import (
   "fmt"
   "time"
)

func do1() {
   do2()
}

func do2() {
   do3()
}

func do3() {
   fmt.Println("do3")
}

func main() {
   go do1()
   time.Sleep(time.Hour)
}

以上代码开启一个do1协程,do1调用do2,do2调用do3。我们通过go build -gcflags -S main.go命令,查看汇编代码,发现多次调用到了runtime.morestack_noctxt方法。在函数跳转的时候,编译器会插入runtime.morestack_noctxt这个方法。目的是检查函数栈空间是否足够。 简略源码如下:

TEXT runtime·morestack_noctxt(SB),NOSPLIT,$0
   MOVL   $0, DX
   JMP    runtime·morestack(SB)
TEXT runtime·morestack(SB),NOSPLIT|NOFRAME,$0-0
   ...
   BL runtime·newstack(SB)
   ...

最终调用到newstack这个go方法。

现在对于运行时间超过10ms的大协程,其g.stackguard0会被赋值为stackPreempt,意味着该协程要切换出去了。

stackPreempt值为0xfffffade

// 0xfffffade in hex.
const stackPreempt = uintptrMask & -1314

于是在newstack方法中会判断g.stackguard0是否为stackPreempt,是则将该协程切换出去。

func newstack() {
        // 判断是否有抢占信号
        preempt := stackguard0 == stackPreempt
        ...
	if preempt {
		...
		// Act like goroutine called runtime.Gosched.
		gopreempt_m(gp) // never return
	}
        ...
}
func gopreempt_m(gp *g) {
   ...
   goschedImpl(gp)
}
func goschedImpl(gp *g) {
   ...
   schedule()
}

以上流程总结来说:

  • Go对大协程会把g.stackguard0标记为stackPreempt。
  • 在大协程调用其它函数时,会调用newstack判断栈空间,顺便判断该协程是否要切换出去。
  • 要切换则进入gopreempt_m -> goschedImpl -> schedule,最终回到线程循环的开头。

流程图如下:

Go 如何实现协程并发执行

基于信号的抢占式调度

如果协程不主动挂起,不系统调用,不调用其它函数,只是纯计算的任务,那该如何切换呢?如下:

go func() {
   i := 0
   for {
      i++
   }
}()

Go就利用了操作系统通信的方式,通过GC的线程向该协程对应的线程发送信号,触发该线程的切换方法。具体步骤为:

  • 注册SIGURG信号的处理函数
  • GC线程工作时,向该目标线程发送信号
  • 线程接收信号后,触发调度方法

流程图如下: Go 如何实现协程并发执行

源码分析:

线程接收到操作系统信号,进入sighandler方法,识别信号为SIGURG,进入doSigPreempt方法。 之后流程:doSigPreempt -> asyncPreempt -> asyncPreempt2 -> mcall -> gopreempt_m -> goschedImpl。 最终调用schedule方法,回到线程开头,完成协程切换。

具体细节各位可以动手查看下,感悟更多。

总结

要使协程并发执行,那各个线程就不能顺序的执行协程,得选择合适的时机将协程切换出去,换另一个协程执行。因此切换时机就特别重要了,所以本篇重点讲解了四种切换方式,分别为:

  • 协程主动挂起,调用gopark函数,使协程主动休眠等待
  • 系统调用完成后,由于io操作挺耗时,代表该协程运行太久了,因此切换协程
  • 基于协作的抢占式调度,协程运行超10ms,就标记为抢占。这时协程在跳转到其它方法时,就把自己切换出去
  • 基于信号的抢占式调度,协程纯自闭,得外部干扰。因此通过GC线程发送信号,触发线程的调度方法

最终总结

本协程系列讲解得差不多了,要的就是一步步深入,主要为:

  • 认识了协程G和线程M抽象成的结构体
  • 深入研究了单线程循环的步骤(重点)
  • 解决了多线程循环竞争协程资源的性能问题
  • GMP调度模型浮出水面,讲解了处理器P获取协程的几种方式。为获取协程方面
  • GMP如何并发的执行协程,协程切换时机有哪些,为调度协程方面

终于揭开Go的一层面纱了...