likes
comments
collection
share

Go Slice 深度解析

作者站长头像
站长
· 阅读数 53

1. Slice

1.1 Slice的类型

Slice由一个指向数组的指针和 两个int类型的变量 长度、容量 组成。

type Slice struct{
    array unsafe.Pointer // 指向底层数组
    len   int // 切片可用元素的个数,使用下标访问元素时,下标不能超过的长度
    cap   int // 底层数组的元素个数,容量 >= 长度
}

1.2 Nil Slice 和 Empty Slice

创建方式nil切片空切片
方式一var s1 []intvar s2 = []int{}
方式二var s4 = *new([]int)var s3 = make([]int, 0)
和 nil 比较truefalse

nil SliceEmpty Slice 的长度和容量都为空 但空切片的指针指向都指向着同一个地址(每台机器可能不同) Go Slice 深度解析

2. Slice 和 Array

2.1 Slice 和 Array的区别

slice 的底层数据是数组,slice 是对数组的封装,它描述一个数组的片段。两者都可以通过下标来访问单个元素。

数组是定长的,长度定义好之后,不能再更改。其长度是类型的一部分,限制了它的表达能力,比如 [1]int 和 [2]int 就是不同的类型。

而切片则非常灵活,它可以动态地扩容。切片的类型和长度无关。 我们写一个函数调用打印二者的 lencap

2.2 Slice 和 Array的传递对比

package main
func main(){
	s := make([]int, 10)
	printSlice(s)

	var a [100]int
	printArray(a)
}

func printSlice(s []int){
	print(len(s))
	print(cap(s))
}

func printArray(a [100]int){
	println(len(a))
	println(cap(a))
}
  • go tool compile -N -S -l main.go 生成汇编代码

    • -N 参数表示禁止编译优化
    • -l 表示禁止内联
    • -S 表示打印汇编
  • printSlice

    • 可以看出传递的是结构体
    • 红线部分为将 Slice 的 lencap 传递给堆栈寄存器

Go Slice 深度解析

  • print函数 将栈底存储的 lencap 传递给栈顶并打印

Go Slice 深度解析

  • printArray
    • 而Array的 lencap 是传入固定的值 Go Slice 深度解析

3. Slice 的 append

3.1 示例

func main() {
	s := make([]int, 0)

	oldCap := cap(s)

	for i := 0; i < 1024; i++ {
		s = append(s, i)

		newCap := cap(s)

		if newCap != oldCap {
			fmt.Printf(" cap = %-4d  ->  cap = %-4d\n",  oldCap,  newCap)
			oldCap = newCap
		}
	}
}

打印结果 Go Slice 深度解析 我们发现好像并非网络上所说的 若老数组的容量 小于 1024 则每次扩容 cap 翻倍,大于则 扩充接近 1/4 的容量 为什么呢?让我们去标准库中寻找结果吧!

3.2 扩容内涵

runtime/slice.go

func growslice(et *_type, old slice, cap int) slice {
	...
	newcap := old.cap
	doublecap := newcap + newcap
	if cap > doublecap {
		newcap = cap
	} else {
		const threshold = 256
		if old.cap < threshold {
			newcap = doublecap
		} else {
			for 0 < newcap && newcap < cap {
				newcap += (newcap + 3*threshold) / 4
			}
			if newcap <= 0 {
				newcap = cap
			}
		}
	}
        // 到这你就不用看了
	var overflow bool
	var lenmem, newlenmem, capmem uintptr
	switch {
	case et.size == 1:
		lenmem = uintptr(old.len)
		newlenmem = uintptr(cap)
		capmem = roundupsize(uintptr(newcap))
		overflow = uintptr(newcap) > maxAlloc
		newcap = int(capmem)
	case et.size == goarch.PtrSize:
		lenmem = uintptr(old.len) * goarch.PtrSize
		newlenmem = uintptr(cap) * goarch.PtrSize
		capmem = roundupsize(uintptr(newcap) * goarch.PtrSize)
		overflow = uintptr(newcap) > maxAlloc/goarch.PtrSize
		newcap = int(capmem / goarch.PtrSize)
	case isPowerOfTwo(et.size):
		var shift uintptr
		if goarch.PtrSize == 8 {
			// Mask shift for better code generation.
			shift = uintptr(sys.Ctz64(uint64(et.size))) & 63
		} else {
			shift = uintptr(sys.Ctz32(uint32(et.size))) & 31
		}
		lenmem = uintptr(old.len) << shift
		newlenmem = uintptr(cap) << shift
		capmem = roundupsize(uintptr(newcap) << shift)
		overflow = uintptr(newcap) > (maxAlloc >> shift)
		newcap = int(capmem >> shift)
	default:
		lenmem = uintptr(old.len) * et.size
		newlenmem = uintptr(cap) * et.size
		capmem, overflow = math.MulUintptr(et.size, uintptr(newcap))
		capmem = roundupsize(capmem)
		newcap = int(capmem / et.size)
	}

	...

不要被这么长的代码吓到,我们先来分析一下前面半段。 cap 是我们将要扩充到的容量,我们先获取 老底层数组的容量的翻倍 doublecap

  • 如果 capdoublecap 还大的话则直接 将新数组容定为 cap
  • 否则我们设置一个门槛(threshold) = 256,
    • 如果扩容前容量 小于 门槛的话直接翻倍
    • 否则 newcap += (newcap + 3*threshold) / 4 直到 newcap 大于 cap

我们拿 512 扩容到 848的例子来试一试: old.cap 大于 threshold,所以进行 newcap += (newcap + 3*threshold) / 4 (512 + 3 * 256)/4 = 320, 512 + 320 = 832 欸?不对啊,不应该是848吗?

不急,我们再回到源码中的 switch 语句中 我们只需要知道 roundupsize 函数的作用是内存对齐,而最终的结果是经过内存对齐后的结果,这也是 扩充后的容量比计算的大的原因了。

3.3 调优

lencap 为0 的Slice中添加三个值, 此时该 Slice的 cap 是多少呢?

s := make([]int, 0)
	s = append(s, 1,2,3)
	print(cap(s))

答案是3, Go在此情况下进行了内存的优化

3.4 append Slice 三种方法对比

  • 方法1:对 len = 0, cap = 0 的Slice进行扩容 10000 次
func BenchmarkAppend1(b *testing.B) {
	b.ReportAllocs()
	for i := 0; i < b.N; i++{
		var s []int
		for j := 0; j < 10000; j++{
			s = append(s, j)
		}
	}
}
  • 方法2:对 len = 0, cap = 10000 的Slice进行扩容 10000 次
func BenchmarkAppend2(b *testing.B) {
	b.ReportAllocs()
	for i := 0; i < b.N; i++{
		s := make([]int, 0, 10000)
		for j := 0; j < 10000; j++{
			s = append(s, j)
		}
	}
}
  • 方法3:对 len = 0, cap = 10000 的Slice进行扩容 10000 次, 但是用 索引赋值
func BenchmarkAppend3(b *testing.B) {
	b.ReportAllocs()
	for i := 0; i < b.N; i++{
		s := make([]int, 10000)
		for j := 0; j < 10000; j++{
			s[j] = j
		}
	}
}

执行结果 可以看出 cap 从0开始扩容明显比 其他两个慢许多 而索引赋值稍快于 append Go Slice 深度解析

  • 为什么索引赋值更快呢?我们看看底层的汇编代码
    • append 赋值 Go Slice 深度解析
    • 索引赋值 Go Slice 深度解析

不用关注具体细节,从代码量来看 索引赋值 明显比 append 赋值少

3.5 简单案例

func main(){
	var s []int
	for i := 0; i < 3; i++{
		s = append(s, i)
	}
	modifySlice(s)
	fmt.Print(s)
}

func modifySlice(s []int){
	s[0] = 1024
}

执行结果为 [1024 1 2] 传递的结构体内有底层数组的指针, 通过指针修改底层数组

我们在 modify 函数内增加一句 append 语句

func main(){
	var s []int
	for i := 0; i < 3; i++{
		s = append(s, i)
	}
	modifySlice(s)
	fmt.Print(s)
}

func modifySlice(s []int){
	s = append(s, 2048)
	s[0] = 1024
}

执行结果为 [1024 1 2] append后 len + 1,由于结构体值传递 len 传递的为值而不向 底层数组传递的是地址(指针用法),所以改动无法回到 main 函数内

再添加一句 append

func main(){
	var s []int
	for i := 0; i < 3; i++{
		s = append(s, i)
	}
	modifySlice(s)
	fmt.Print(s)
}

func modifySlice(s []int){
	s = append(s, 2048)
	s = append(s, 4096)
	s[0] = 1024
}

执行结果为 [0 1 2] 第二次 append 时由于 cap 不够了,Slice 进行扩容操作, 新建了一个底层数组并指向它,从此函数的 Slice 的数组指针 和 main函数的 Slice的数组指针不再相同(地址不一样),函数内对数组的修改不再作用于 main 函数

4. 小技巧 Bounds Checking Elimination 边界检查

  • 平常我们获取 Slice 内容时都是直接获取
func nomal(s []int){
	i := 0
	i += s[0]
	i += s[1]
	i += s[2]
}
  • 但我们可以在获取之前 对要获取的最大索引进行检查
func bce(s []int){
	_ = s[2]
	i := 0
	i += s[0]
	i += s[1]
	i += s[2]
}

这样会加快我们的运行效率。 为什么呢?让我们从汇编的角度去看看吧!

  • nomal函数调用时 由于索引是递增调用,编译器无法确定索引值是否存在,所以每次赋值前都需先比较一次,若不存在则 JLS(跳跃到) 相应语句,执行 panicIndex Go Slice 深度解析
  • 而 边界检查先将所需要使用的最大的索引进行赋值判断, 编译器知道最大的索引是否存在后,即可不再判断其余的索引了 Go Slice 深度解析

本节内容到此结束!感谢阅读。

转载自:https://juejin.cn/post/7170008177465884709
评论
请登录