你好,我是鸟窝。

在这节课正式开始之前,我想先带你看一个工作中的场景。

假设有一天你进入办公室,突然同事们都围住你,然后大喊“小王小王你最帅”,此时你可能一头雾水,只能尴尬地笑笑。为啥呢?因为你缺少上下文的信息,不知道之前发生了什么。

但是,如果同事告诉你,由于你业绩突出,一天之内就把云服务化的主要架构写好了,因此被评为9月份的工作之星,总经理还特意给你发1万元的奖金,那么,你心里就很清楚了,原来同事恭喜你,是因为你的工作被表扬了,还获得了奖金。同事告诉你的这些前因后果,就是上下文信息,他把上下文传递给你,你接收后,就可以获取之前不了解的信息。

你看,上下文(Context)就是这么重要。在我们的开发场景中,上下文也是不可或缺的,缺少了它,我们就不能获取完整的程序信息。那到底啥是上下文呢?其实,这就是指,在API之间或者方法调用之间,所传递的除了业务参数之外的额外信息。

比如,服务端接收到客户端的HTTP请求之后,可以把客户端的IP地址和端口、客户端的身份信息、请求接收的时间、Trace ID等信息放入到上下文中,这个上下文可以在后端的方法调用中传递,后端的业务方法除了利用正常的参数做一些业务处理(如订单处理)之外,还可以从上下文读取到消息请求的时间、Trace ID等信息,把服务处理的时间推送到Trace服务中。Trace服务可以把同一Trace ID的不同方法的调用顺序和调用时间展示成流程图,方便跟踪。

不过,Go标准库中的Context功能还不止于此,它还提供了超时(Timeout)和取消(Cancel)的机制,下面就让我一一道来。

Context的来历

在学习Context的功能之前呢,我先带你了解下它的来历。毕竟,知道了它的来龙去脉,我们才能应用得更加得心应手一些。

Go在1.7的版本中才正式把Context加入到标准库中。在这之前,很多Web框架在定义自己的handler时,都会传递一个自定义的Context,把客户端的信息和客户端的请求信息放入到Context中。Go最初提供了golang.org/x/net/context库用来提供上下文信息,最终还是在Go1.7中把此库提升到标准库context包中。

为啥呢?这是因为,在Go1.7之前,有很多库都依赖golang.org/x/net/context中的Context实现,这就导致Go 1.7发布之后,出现了标准库Context和golang.org/x/net/context并存的状况。新的代码使用标准库Context的时候,没有办法使用这个标准库的Context去调用旧有的使用x/net/context实现的方法。

所以,在Go1.9中,还专门实现了一个叫做type alias的新特性,然后把x/net/context中的Context定义成标准库Context的别名,以解决新旧Context类型冲突问题,你可以看一下下面这段代码:

    // +build go1.9
	package context
	
	import "context"
	
	type Context = context.Context
	type CancelFunc = context.CancelFunc

Go标准库的Context不仅提供了上下文传递的信息,还提供了cancel、timeout等其它信息,这些信息貌似和context这个包名没关系,但是还是得到了广泛的应用。所以,你看,context包中的Context不仅仅传递上下文信息,还有timeout等其它功能,是不是“名不副实”呢?

其实啊,这也是这个Context的一个问题,比较容易误导人,Go布道师Dave Cheney还专门写了一篇文章讲述这个问题:Context isn’t for cancellation

同时,也有一些批评者针对Context提出了批评:Context should go away for Go 2,这篇文章把Context比作病毒,病毒会传染,结果把所有的方法都传染上了病毒(加上Context参数),绝对是视觉污染。

Go的开发者也注意到了“关于Context,存在一些争议”这件事儿,所以,Go核心开发者Ian Lance Taylor专门开了一个issue 28342,用来记录当前的Context的问题:

尽管有很多的争议,但是,在很多场景下,使用Context其实会很方便,所以现在它已经在Go生态圈中传播开来了,包括很多的Web应用框架,都切换成了标准库的Context。标准库中的database/sql、os/exec、net、net/http等包中都使用到了Context。而且,如果我们遇到了下面的一些场景,也可以考虑使用Context:

所以,我们需要掌握Context的具体用法,这样才能在不影响主要业务流程实现的时候,实现一些通用的信息传递,或者是能够和其它goroutine协同工作,提供timeout、cancel等机制。

Context基本使用方法

首先,我们来学习一下Context接口包含哪些方法,这些方法都是干什么用的。

包context定义了Context接口,Context的具体实现包括4个方法,分别是Deadline、Done、Err和Value,如下所示:

type Context interface {
    Deadline() (deadline time.Time, ok bool)
    Done() <-chan struct{}
    Err() error
    Value(key interface{}) interface{}
}

下面我来具体解释下这4个方法。

Deadline方法会返回这个Context被取消的截止日期。如果没有设置截止日期,ok的值是false。后续每次调用这个对象的Deadline方法时,都会返回和第一次调用相同的结果。

Done方法返回一个Channel对象。在Context被取消时,此Channel会被close,如果没被取消,可能会返回nil。后续的Done调用总是返回相同的结果。当Done被close的时候,你可以通过ctx.Err获取错误信息。Done这个方法名其实起得并不好,因为名字太过笼统,不能明确反映Done被close的原因,因为cancel、timeout、deadline都可能导致Done被close,不过,目前还没有一个更合适的方法名称。

关于Done方法,你必须要记住的知识点就是:如果Done没有被close,Err方法返回nil;如果Done被close,Err方法会返回Done被close的原因。

Value返回此ctx中和指定的key相关联的value。

Context中实现了2个常用的生成顶层Context的方法。

官方文档是这么讲的,你可能会觉得像没说一样,因为界限并不是很明显。其实,你根本不用费脑子去考虑,可以直接使用context.Background。事实上,它们两个底层的实现是一模一样的:

var (
    background = new(emptyCtx)
    todo       = new(emptyCtx)
)

func Background() Context {
    return background
}

func TODO() Context {
    return todo
}

在使用Context的时候,有一些约定俗成的规则。

  1. 一般函数使用Context的时候,会把这个参数放在第一个参数的位置。
  2. 从来不把nil当做Context类型的参数值,可以使用context.Background()创建一个空的上下文对象,也不要使用nil。
  3. Context只用来临时做函数之间的上下文透传,不能持久化Context或者把Context长久保存。把Context持久化到数据库、本地文件或者全局变量、缓存中都是错误的用法。
  4. key的类型不应该是字符串类型或者其它内建类型,否则容易在包之间使用Context时候产生冲突。使用WithValue时,key的类型应该是自己定义的类型。
  5. 常常使用struct{}作为底层类型定义key的类型。对于exported key的静态类型,常常是接口或者指针。这样可以尽量减少内存分配。

其实官方的文档也是比较搞笑的,文档中强调key的类型不要使用string,结果接下来的例子中就是用string类型作为key的类型。你自己把握住这个要点就好,如果你能保证别人使用你的Context时不会和你定义的key冲突,那么key的类型就比较随意,因为你自己保证了不同包的key不会冲突,否则建议你尽量采用保守的unexported的类型。

创建特殊用途Context的方法

接下来,我会介绍标准库中几种创建特殊用途Context的方法:WithValue、WithCancel、WithTimeout和WithDeadline,包括它们的功能以及实现方式。

WithValue

WithValue基于parent Context生成一个新的Context,保存了一个key-value键值对。它常常用来传递上下文。

WithValue方法其实是创建了一个类型为valueCtx的Context,它的类型定义如下:

type valueCtx struct {
    Context
    key, val interface{}
}

它持有一个key-value键值对,还持有parent的Context。它覆盖了Value方法,优先从自己的存储中检查这个key,不存在的话会从parent中继续检查。

Go标准库实现的Context还实现了链式查找。如果不存在,还会向parent Context去查找,如果parent还是valueCtx的话,还是遵循相同的原则:valueCtx会嵌入parent,所以还是会查找parent的Value方法的。

ctx = context.TODO()
ctx = context.WithValue(ctx, "key1", "0001")
ctx = context.WithValue(ctx, "key2", "0001")
ctx = context.WithValue(ctx, "key3", "0001")
ctx = context.WithValue(ctx, "key4", "0004")

fmt.Println(ctx.Value("key1"))

WithCancel

WithCancel 方法返回parent的副本,只是副本中的Done Channel是新建的对象,它的类型是cancelCtx。

我们常常在一些需要主动取消长时间的任务时,创建这种类型的Context,然后把这个Context传给长时间执行任务的goroutine。当需要中止任务时,我们就可以cancel这个Context,这样长时间执行任务的goroutine,就可以通过检查这个Context,知道Context已经被取消了。

WithCancel返回值中的第二个值是一个cancel函数。其实,这个返回值的名称(cancel)和类型(Cancel)也非常迷惑人。

记住,不是只有你想中途放弃,才去调用cancel,只要你的任务正常完成了,就需要调用cancel,这样,这个Context才能释放它的资源(通知它的children 处理cancel,从它的parent中把自己移除,甚至释放相关的goroutine)。很多同学在使用这个方法的时候,都会忘记调用cancel,切记切记,而且一定尽早释放。

我们来看下WithCancel方法的实现代码:

func WithCancel(parent Context) (ctx Context, cancel CancelFunc) {
    c := newCancelCtx(parent)
    propagateCancel(parent, &c)// 把c朝上传播
    return &c, func() { c.cancel(true, Canceled) }
}

// newCancelCtx returns an initialized cancelCtx.
func newCancelCtx(parent Context) cancelCtx {
    return cancelCtx{Context: parent}
}

代码中调用的propagateCancel方法会顺着parent路径往上找,直到找到一个cancelCtx,或者为nil。如果不为空,就把自己加入到这个cancelCtx的child,以便这个cancelCtx被取消的时候通知自己。如果为空,会新起一个goroutine,由它来监听parent的Done是否已关闭。

当这个cancelCtx的cancel函数被调用的时候,或者parent的Done被close的时候,这个cancelCtx的Done才会被close。

cancel是向下传递的,如果一个WithCancel生成的Context被cancel时,如果它的子Context(也有可能是孙,或者更低,依赖子的类型)也是cancelCtx类型的,就会被cancel,但是不会向上传递。parent Context不会因为子Context被cancel而cancel。

cancelCtx被取消时,它的Err字段就是下面这个Canceled错误:

var Canceled = errors.New("context canceled")

WithTimeout

WithTimeout其实是和WithDeadline一样,只不过一个参数是超时时间,一个参数是截止时间。超时时间加上当前时间,其实就是截止时间,因此,WithTimeout的实现是:

func WithTimeout(parent Context, timeout time.Duration) (Context, CancelFunc) {
    // 当前时间+timeout就是deadline
    return WithDeadline(parent, time.Now().Add(timeout))
}

WithDeadline

WithDeadline会返回一个parent的副本,并且设置了一个不晚于参数d的截止时间,类型为timerCtx(或者是cancelCtx)。

如果它的截止时间晚于parent的截止时间,那么就以parent的截止时间为准,并返回一个类型为cancelCtx的Context,因为parent的截止时间到了,就会取消这个cancelCtx。

如果当前时间已经超过了截止时间,就直接返回一个已经被cancel的timerCtx。否则就会启动一个定时器,到截止时间取消这个timerCtx。

综合起来,timerCtx的Done被Close掉,主要是由下面的某个事件触发的:

下面的代码是WithDeadline方法的实现:

func WithDeadline(parent Context, d time.Time) (Context, CancelFunc) {
    // 如果parent的截止时间更早,直接返回一个cancelCtx即可
    if cur, ok := parent.Deadline(); ok && cur.Before(d) {
        return WithCancel(parent)
    }
    c := &timerCtx{
        cancelCtx: newCancelCtx(parent),
        deadline:  d,
    }
    propagateCancel(parent, c) // 同cancelCtx的处理逻辑
    dur := time.Until(d)
    if dur <= 0 { //当前时间已经超过了截止时间,直接cancel
        c.cancel(true, DeadlineExceeded)
        return c, func() { c.cancel(false, Canceled) }
    }
    c.mu.Lock()
    defer c.mu.Unlock()
    if c.err == nil {
        // 设置一个定时器,到截止时间后取消
        c.timer = time.AfterFunc(dur, func() {
            c.cancel(true, DeadlineExceeded)
        })
    }
    return c, func() { c.cancel(true, Canceled) }
}

和cancelCtx一样,WithDeadline(WithTimeout)返回的cancel一定要调用,并且要尽可能早地被调用,这样才能尽早释放资源,不要单纯地依赖截止时间被动取消。正确的使用姿势是啥呢?我们来看一个例子。

func slowOperationWithTimeout(ctx context.Context) (Result, error) {
	ctx, cancel := context.WithTimeout(ctx, 100*time.Millisecond)
	defer cancel() // 一旦慢操作完成就立马调用cancel
	return slowOperation(ctx)
}

总结

我们经常使用Context来取消一个goroutine的运行,这是Context最常用的场景之一,Context也被称为goroutine生命周期范围(goroutine-scoped)的Context,把Context传递给goroutine。但是,goroutine需要尝试检查Context的Done是否关闭了:

func main() {
    ctx, cancel := context.WithCancel(context.Background())

    go func() {
        defer func() {
            fmt.Println("goroutine exit")
        }()

        for {
            select {
            case <-ctx.Done():
                return
            default:
                time.Sleep(time.Second)
            }
        }
    }()

    time.Sleep(time.Second)
    cancel()
    time.Sleep(2 * time.Second)
}

如果你要为Context实现一个带超时功能的调用,比如访问远程的一个微服务,超时并不意味着你会通知远程微服务已经取消了这次调用,大概率的实现只是避免客户端的长时间等待,远程的服务器依然还执行着你的请求。

所以,有时候,Context并不会减少对服务器的请求负担。如果在Context被cancel的时候,你能关闭和服务器的连接,中断和数据库服务器的通讯、停止对本地文件的读写,那么,这样的超时处理,同时能减少对服务调用的压力,但是这依赖于你对超时的底层处理机制。

思考题

使用WithCancel和WithValue写一个级联的使用Context的例子,验证一下parent Context被cancel后,子conext是否也立刻被cancel了。

欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得有所收获,也欢迎你把今天的内容分享给你的朋友或同事。

评论