GO 切片實力踩坑

概述

GO 語言的切片這兩天用了用, 可以支持切割數組的中間部分. 但今天使用中, 出了 bug, 查了半天, 發現是切片的問題, 簡單寫個 demo 復現當時的情況:

package main

import "fmt"

func main() {
	a := []int{1, 2, 3, 4, 5}
	b := a[2:4]
	b[0] = 9
	fmt.Println(a)
}

你以爲輸出的是什麼? 來, 看結果:

[1 2 9 4 5]

懵沒懵?? 這是怎麼回事呢?

(我用個語言怎麼老踩坑, 笨的一X)

解惑

看這段 GO 代碼的輸出, 我們在修改b數組第一個元素值的時候, a數組的第三個元素修改了, 這兩個有什麼聯繫嗎? 仔細看, b數組在切的時候, 切的不就是a數組第三第四的元素嗎? 如此看來, b[0] 不正對應 a[2] 嗎?

大膽假設: **GO 中對數組進行切割, 並不會切一個新的數組出來, 而是仍然使用原數組, 只是修改下數組的首地址和長度. **

驗證:

package main

import "fmt"

func main() {
	a := []int{1, 2, 3, 4, 5}
	b := a[2:4]
	b[0] = 9
	fmt.Printf("%p\n", &a[2])
	fmt.Printf("%p\n", &b[0])
}

打印出來的地址完全一致, 印證了之前的猜想, 果然是一個數組. 同時修改a數組, 也會影響到b數組.

那可不可以對b數組越界訪問, 訪問a數組的值呢? 不行, GO 會對數組進行越界檢查.

查看文檔後發現, GO 切片的內部實現是這樣的包含了三個字段. 其中各字段含義如下:

  1. 數組首地址指針: 指向底層數組的首地址(這個是真正的數組)
  2. 數組長度: 數組當前已經使用的長度
  3. 數組容量: 數組已分配內存的總長度, 比數組長度多出的部分, 是佔用內存還沒有使用的.

如此看來, 對其進行切割, 並不會整個複製, 對於大切片的操作就顯得很友好了, 畢竟共享底層數組, 只需要創建很少的數據就可以了. 只是要注意數組的同步修改問題.

這麼看來, 貌似也可以解釋爲什麼叫切片了. **切片就是將底層的數組切出一部分來, 而不會創建新的數組. **

切片是有容量的, 那上面的切片b的容量是多少呢? 我看了一下: 長度是2, 容量是3.

GO 的切片在容量足夠的時候, 是不會動態擴容的. (擴容會創建更大容量新的數組並複製原數組數據). 那也就是說, 如果我向b追加數據, 就可以影響到原數組的後面的數據了??

試一發:

package main

import "fmt"

func main() {
	a := []int{1, 2, 3, 4, 5}
	b := a[2:4]
	b = append(b, 10)
	fmt.Println(b)
	fmt.Println(a)
}

果然, 容量允許的話, 追加操作使用的仍然是原始數組.

所以: 切片的容量其實是底層數組的容量

同時, 有了之前對 GO 的瞭解, 知道 GO 所有的函數都是以傳遞副本值的方式進行, 傳遞切片也一樣, 而切片的結構體包含(數組指針, 長度, 容量)三個元素, 底層數組並不屬於值本身, 所以切片在函數間傳遞的複製成本很小, 而且函數對切片的修改也會反應到底層數組上. 同理可得, 如果在函數中對切片執行了擴容操作, 那改動就不會影響原數據, 因爲擴容後操作的是新的數組了.

OK. 切片到這裏就結束了, 簡單說就是數組上面再套一層. 切片的切片共享底層數組.

最後說一句, GO 創建數組和切片的方式(數組和切片是不同的數據結構):

// 方括號爲空, 創建的是切片類型
a := []int{1, 2}
// 方括號指定長度, 創建的是真正的數組類型
b := [2]int{}

總結

至此, 對 GO 的切片有了全新的認識. 在使用切片的時候, 需要特別注意, 切片的截取與原對象共享底層數組, 在數據修改時要特別注意.

如果需要一個安全的可修改的切片, 可以使用copy函數複製一個全新的數組出來, 與原數組分離就可以了.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章