概述
GO 語言的切片這兩天用了用, 可以支持切割數組的中間部分. 但今天使用中, 出了 bug, 查了半天, 發現是切片的問題, 簡單寫個 demo 復現當時的情況:
package main
import "fmt"
func main() {
a := []int{1, 2, 3, 4, 5}
b := a[2:4]
b[0] = 9
fmt.Println(a)
}
你以爲輸出的是什麼? 來, 看結果:
[1 2 9 4 5]
懵沒懵?? 這是怎麼回事呢?
(我用個語言怎麼老踩坑, 笨的一X)
解惑
看這段 GO 代碼的輸出, 我們在修改b
數組第一個元素值的時候, a
數組的第三個元素修改了, 這兩個有什麼聯繫嗎? 仔細看, b
數組在切的時候, 切的不就是a
數組第三第四的元素嗎? 如此看來, b[0]
不正對應 a[2]
嗎?
大膽假設: **GO 中對數組進行切割, 並不會切一個新的數組出來, 而是仍然使用原數組, 只是修改下數組的首地址和長度. **
驗證:
package main
import "fmt"
func main() {
a := []int{1, 2, 3, 4, 5}
b := a[2:4]
b[0] = 9
fmt.Printf("%p\n", &a[2])
fmt.Printf("%p\n", &b[0])
}
打印出來的地址完全一致, 印證了之前的猜想, 果然是一個數組. 同時修改a
數組, 也會影響到b
數組.
那可不可以對b
數組越界訪問, 訪問a
數組的值呢? 不行, GO 會對數組進行越界檢查.
查看文檔後發現, GO 切片的內部實現是這樣的包含了三個字段. 其中各字段含義如下:
- 數組首地址指針: 指向底層數組的首地址(這個是真正的數組)
- 數組長度: 數組當前已經使用的長度
- 數組容量: 數組已分配內存的總長度, 比數組長度多出的部分, 是佔用內存還沒有使用的.
如此看來, 對其進行切割, 並不會整個複製, 對於大切片的操作就顯得很友好了, 畢竟共享底層數組, 只需要創建很少的數據就可以了. 只是要注意數組的同步修改問題.
這麼看來, 貌似也可以解釋爲什麼叫切片了. **切片就是將底層的數組切出一部分來, 而不會創建新的數組. **
切片是有容量的, 那上面的切片b
的容量是多少呢? 我看了一下: 長度是2, 容量是3.
GO 的切片在容量足夠的時候, 是不會動態擴容的. (擴容會創建更大容量新的數組並複製原數組數據). 那也就是說, 如果我向b
追加數據, 就可以影響到原數組的後面的數據了??
試一發:
package main
import "fmt"
func main() {
a := []int{1, 2, 3, 4, 5}
b := a[2:4]
b = append(b, 10)
fmt.Println(b)
fmt.Println(a)
}
果然, 容量允許的話, 追加操作使用的仍然是原始數組.
所以: 切片的容量其實是底層數組的容量
同時, 有了之前對 GO 的瞭解, 知道 GO 所有的函數都是以傳遞副本值的方式進行, 傳遞切片也一樣, 而切片的結構體包含(數組指針, 長度, 容量)三個元素, 底層數組並不屬於值本身, 所以切片在函數間傳遞的複製成本很小, 而且函數對切片的修改也會反應到底層數組上. 同理可得, 如果在函數中對切片執行了擴容操作, 那改動就不會影響原數據, 因爲擴容後操作的是新的數組了.
OK. 切片到這裏就結束了, 簡單說就是數組上面再套一層. 切片的切片共享底層數組.
最後說一句, GO 創建數組和切片的方式(數組和切片是不同的數據結構):
// 方括號爲空, 創建的是切片類型
a := []int{1, 2}
// 方括號指定長度, 創建的是真正的數組類型
b := [2]int{}
總結
至此, 對 GO 的切片有了全新的認識. 在使用切片的時候, 需要特別注意, 切片的截取與原對象共享底層數組, 在數據修改時要特別注意.
如果需要一個安全的可修改的切片, 可以使用copy
函數複製一個全新的數組出來, 與原數組分離就可以了.