本文主要介紹Go語言中切片(slice)及它的基本使用。
引子
因爲數組的長度是固定的並且數組長度屬於類型的一部分,所以數組有很多的侷限性。 例如:
func arraySum(x [3]int) int{
sum := 0
for _, v := range x{
sum = sum + v
}
return sum
}
這個求和函數只能接受[3]int
類型,其他的都不支持。 再比如:
a := [3]int{1, 2, 3}
數組a中已經有三個元素了,我們不能再繼續往數組a中添加新元素了。
切片
切片(Slice)是一個擁有相同類型元素的可變長度的序列。它是基於數組類型做的一層封裝。它非常靈活,支持自動擴容。
切片是一個引用類型,它的內部結構包含地址
、長度
和容量
。切片一般用於快速地操作一塊數據集合。
切片的定義 |
聲明切片類型的基本語法如下:
var name []T
其中:
- name:表示變量名
- T:表示切片中的元素類型
舉個例子:
func main() {
// 聲明切片類型
var a []string //聲明一個字符串切片
var b = []int{} //聲明一個整型切片並初始化
var c = []bool{false, true} //聲明一個布爾切片並初始化
var d = []bool{false, true} //聲明一個布爾切片並初始化
fmt.Println(a) //[]
fmt.Println(b) //[]
fmt.Println(c) //[false true]
fmt.Println(a == nil) //true
fmt.Println(b == nil) //false
fmt.Println(c == nil) //false
// fmt.Println(c == d) //切片是引用類型,不支持直接比較,只能和nil比較
}
| 切片的長度和容量
切片擁有自己的長度和容量,我們可以通過使用內置的len()
函數求長度,使用內置的cap()
函數求切片的容量。
| 切片表達式
切片表達式從字符串、數組、指向數組或切片的指針構造子字符串或切片。它有兩種變體:一種指定low和high兩個索引界限值的簡單的形式,另一種是除了low和high索引界限值外還指定容量的完整的形式。
簡單切片表達式
切片的底層就是一個數組,所以我們可以基於數組通過切片表達式得到切片。 切片表達式中的low
和high
表示一個索引範圍(左包含,又不包含),也就是下面代碼中從數組a中選出1<=索引值<4
的元素組成切片s,得到的切片長度=high-low
,容量等於得到的切片的底層數組的容量。
func main() {
a := [5]int{1, 2, 3, 4, 5}
s := a[1:3] // s := a[low:high]
fmt.Printf("s:%v len(s):%v cap(s):%v\n", s, len(s), cap(s))
}
輸出:
s:[2 3] len(s):2 cap(s):4
爲了方便起見,可以省略切片表達式中的任何索引。省略了low
則默認爲0;省略了high
則默認爲切片操作數的長度:
a[2:] // 等同於 a[2:len(a)]
a[:3] // 等同於 a[0:3]
a[:] // 等同於 a[0:len(a)]
注意:
對於數組或字符串,如果0 <= low <= high <= len(a)
,則索引合法,否則就會索引越界(out of range)。
對切片再執行切片表達式時(切片再切片),high
的上限邊界是切片的容量cap(a)
,而不是長度。常量索引 必須是非負的,並且可以用int類型的值表示;對於數組或常量字符串,常量索引也必須在有效範圍內。如果low
和high
兩個指標都是常數,它們必須滿足low <= high
。如果索引在運行時超出範圍,就會發生運行時panic
。
func main() {
a := [5]int{1, 2, 3, 4, 5}
s := a[1:3] // s := a[low:high]
fmt.Printf("s:%v len(s):%v cap(s):%v\n", s, len(s), cap(s))
s2 := s[3:4] // 索引的上限是cap(s)而不是len(s)
fmt.Printf("s2:%v len(s2):%v cap(s2):%v\n", s2, len(s2), cap(s2))
}
輸出:
s:[2 3] len(s):2 cap(s):4
s2:[5] len(s2):1 cap(s2):1
完整切片表達式
對於數組,指向數組的指針,或切片a(注意不能是字符串)支持完整切片表達式:
a[low : high : max]
上面的代碼會構造與簡單切片表達式a[low: high]
相同類型、相同長度和元素的切片。另外,它會將得到的結果切片的容量設置爲max-low
。在完整切片表達式中只有第一個索引值(low)可以省略;它默認爲0。
func main() {
a := [5]int{1, 2, 3, 4, 5}
t := a[1:3:5]
fmt.Printf("t:%v len(t):%v cap(t):%v\n", t, len(t), cap(t))
}
輸出結果:
t:[2 3] len(t):2 cap(t):4
完整切片表達式需要滿足的條件是0 <= low <= high <= max <= cap(a)
,其他條件和簡單切片表達式相同。
| 使用make()函數構造切片
我們上面都是基於數組來創建的切片,如果需要動態的創建一個切片,我們就需要使用內置的make()
函數,格式如下:
make([]T, size, cap)
其中:
- T:切片的元素類型
- size:切片中元素的數量
- cap:切片的容量
舉個例子:
func main() {
a := make([]int, 2, 10)
fmt.Println(a) //[0 0]
fmt.Println(len(a)) //2
fmt.Println(cap(a)) //10
}
上面代碼中a
的內部存儲空間已經分配了10個,但實際上只用了2個。 容量並不會影響當前元素的個數,所以len(a)
返回2,cap(a)
則返回該切片的容量。
| 切片的本質
切片的本質就是對底層數組的封裝,它包含了三個信息:底層數組的指針、切片的長度(len)和切片的容量(cap)。
舉個例子,現在有一個數組a := [8]int{0, 1, 2, 3, 4, 5, 6, 7}
,切片s1 := a[:5]
,相應示意圖如下。
切片s2 := a[3:6]
,相應示意圖如下:
| 判斷切片是否爲空
要檢查切片是否爲空,請始終使用len(s) == 0
來判斷,而不應該使用s == nil
來判斷。
切片不能直接比較 |
切片之間是不能比較的,我們不能使用==
操作符來判斷兩個切片是否含有全部相等元素。 切片唯一合法的比較操作是和nil
比較。 一個nil
值的切片並沒有底層數組,一個nil
值的切片的長度和容量都是0。但是我們不能說一個長度和容量都是0的切片一定是nil
,例如下面的示例:
var s1 []int //len(s1)=0;cap(s1)=0;s1==nil
s2 := []int{} //len(s2)=0;cap(s2)=0;s2!=nil
s3 := make([]int, 0) //len(s3)=0;cap(s3)=0;s3!=nil
所以要判斷一個切片是否是空的,要是用len(s) == 0
來判斷,不應該使用s == nil
來判斷。
切片的賦值拷貝 |
下面的代碼中演示了拷貝前後兩個變量共享底層數組,對一個切片的修改會影響另一個切片的內容,這點需要特別注意。
func main() {
s1 := make([]int, 3) //[0 0 0]
s2 := s1 //將s1直接賦值給s2,s1和s2共用一個底層數組
s2[0] = 100
fmt.Println(s1) //[100 0 0]
fmt.Println(s2) //[100 0 0]
}
切片遍歷 |
切片的遍歷方式和數組是一致的,支持索引遍歷和for range
遍歷。
func main() {
s := []int{1, 3, 5}
for i := 0; i < len(s); i++ {
fmt.Println(i, s[i])
}
for index, value := range s {
fmt.Println(index, value)
}
}
append()方法爲切片添加元素 |
Go語言的內建函數append()
可以爲切片動態添加元素。 可以一次添加一個元素,可以添加多個元素,也可以添加另一個切片中的元素(後面加…)
func main(){
var s []int
s = append(s, 1) // [1]
s = append(s, 2, 3, 4) // [1 2 3 4]
s2 := []int{5, 6, 7}
s = append(s, s2...) // [1 2 3 4 5 6 7]
}
注意: 通過var
聲明的零值切片可以在append()
函數直接使用,無需初始化。
var s []int
s = append(s, 1, 2, 3)
沒有必要像下面的代碼一樣初始化一個切片再傳入append()
函數使用,
s := []int{} // 沒有必要初始化
s = append(s, 1, 2, 3)
var s = make([]int) // 沒有必要初始化
s = append(s, 1, 2, 3)
每個切片會指向一個底層數組,這個數組的容量夠用就添加新增元素。當底層數組不能容納新增的元素時,切片就會自動按照一定的策略進行“擴容”,此時該切片指向的底層數組就會更換。“擴容”操作往往發生在append()
函數調用時,所以我們通常都需要用原變量接收append函數的返回值。
舉個例子:
func main() {
//append()添加元素和切片擴容
var numSlice []int
for i := 0; i < 10; i++ {
numSlice = append(numSlice, i)
fmt.Printf("%v len:%d cap:%d ptr:%p\n", numSlice, len(numSlice), cap(numSlice), numSlice)
}
}
輸出:
[0] len:1 cap:1 ptr:0xc0000a8000
[0 1] len:2 cap:2 ptr:0xc0000a8040
[0 1 2] len:3 cap:4 ptr:0xc0000b2020
[0 1 2 3] len:4 cap:4 ptr:0xc0000b2020
[0 1 2 3 4] len:5 cap:8 ptr:0xc0000b6000
[0 1 2 3 4 5] len:6 cap:8 ptr:0xc0000b6000
[0 1 2 3 4 5 6] len:7 cap:8 ptr:0xc0000b6000
[0 1 2 3 4 5 6 7] len:8 cap:8 ptr:0xc0000b6000
[0 1 2 3 4 5 6 7 8] len:9 cap:16 ptr:0xc0000b8000
[0 1 2 3 4 5 6 7 8 9] len:10 cap:16 ptr:0xc0000b8000
從上面的結果可以看出:
append()
函數將元素追加到切片的最後並返回該切片。- 切片numSlice的容量按照1,2,4,8,16這樣的規則自動進行擴容,每次擴容後都是擴容前的2倍。
append()
函數還支持一次性追加多個元素。 例如:
var citySlice []string
// 追加一個元素
citySlice = append(citySlice, "北京")
// 追加多個元素
citySlice = append(citySlice, "上海", "廣州", "深圳")
// 追加切片
a := []string{"成都", "重慶"}
citySlice = append(citySlice, a...)
fmt.Println(citySlice) //[北京 上海 廣州 深圳 成都 重慶]
切片的擴容策略 |
可以通過查看$GOROOT/src/runtime/slice.go源碼,其中擴容相關代碼如下:
newcap := old.cap
doublecap := newcap + newcap
if cap > doublecap {
newcap = cap
} else {
if old.len < 1024 {
newcap = doublecap
} else {
// Check 0 < newcap to detect overflow
// and prevent an infinite loop.
for 0 < newcap && newcap < cap {
newcap += newcap / 4
}
// Set newcap to the requested cap when
// the newcap calculation overflowed.
if newcap <= 0 {
newcap = cap
}
}
}
從上面的代碼可以看出以下內容:
- 首先判斷,如果新申請容量(cap)大於2倍的舊容量(old.cap),最終容量(newcap)就是新申請的容量(cap)。
- 否則判斷,如果舊切片的長度小於1024,則最終容量(newcap)就是舊容量(old.cap)的兩倍,即(newcap=doublecap),
- 否則判斷,如果舊切片長度大於等於1024,則最終容量(newcap)從舊容量(old.cap)開始循環增加原來的1/4,即(newcap=old.cap,for {newcap += newcap/4})直到最終容量(newcap)大於等於新申請的容量(cap),即(newcap >= cap)
- 如果最終容量(cap)計算值溢出,則最終容量(cap)就是新申請容量(cap)。
需要注意的是,切片擴容還會根據切片中元素的類型不同而做不同的處理,比如int
和string
類型的處理方式就不一樣。
使用copy()函數複製切片 |
首先我們來看一個問題:
func main() {
a := []int{1, 2, 3, 4, 5}
b := a
fmt.Println(a) //[1 2 3 4 5]
fmt.Println(b) //[1 2 3 4 5]
b[0] = 1000
fmt.Println(a) //[1000 2 3 4 5]
fmt.Println(b) //[1000 2 3 4 5]
}
由於切片是引用類型,所以a和b其實都指向了同一塊內存地址。修改b的同時a的值也會發生變化。
Go語言內建的copy()
函數可以迅速地將一個切片的數據複製到另外一個切片空間中,copy()
函數的使用格式如下:
copy(destSlice, srcSlice []T)
其中:
- srcSlice: 數據來源切片
- destSlice: 目標切片
舉個例子:
func main() {
// copy()複製切片
a := []int{1, 2, 3, 4, 5}
c := make([]int, 5, 5)
copy(c, a) //使用copy()函數將切片a中的元素複製到切片c
fmt.Println(a) //[1 2 3 4 5]
fmt.Println(c) //[1 2 3 4 5]
c[0] = 1000
fmt.Println(a) //[1 2 3 4 5]
fmt.Println(c) //[1000 2 3 4 5]
}
從切片中刪除元素 |
Go語言中並沒有刪除切片元素的專用方法,我們可以使用切片本身的特性來刪除元素。 代碼如下:
func main() {
// 從切片中刪除元素
a := []int{30, 31, 32, 33, 34, 35, 36, 37}
// 要刪除索引爲2的元素
a = append(a[:2], a[3:]...)
fmt.Println(a) //[30 31 33 34 35 36 37]
}
總結一下就是:要從切片a中刪除索引爲index
的元素,操作方法是a = append(a[:index], a[index+1:]…)
練習
- 請寫出下面代碼的輸出結果。
func main() {
var a = make([]string, 5, 10)
for i := 0; i < 10; i++ {
a = append(a, fmt.Sprintf("%v", i))
}
fmt.Println(a)
}
- 請使用內置的sort包對數組var a = […]int{3, 7, 8, 9, 1}進行排序(附加題,自行查資料解答)。
【對比python】
切片是 Python 的一種高級特性,常用於截取序列類型的元素,但並不侷限於此,下面主要介紹了它的基礎用法、自定義對象切片、以及迭代器切片等使用內容。
索引與切片的基本使用:
li = [1, 4, 5, 6, 7, 9, 11, 14, 16]
# 以下寫法都可以表示整個列表,其中 X >= len(li)
li[0:X] == li[0:] == li[:X] == li[:]
== li[::] == li[-X:X] == li[-X:]
li[1:5] == [4,5,6,7] # 從1起,取5-1位元素
li[1:5:2] == [4,6] # 從1起,取5-1位元素,按2間隔過濾
li[-1:] == [16] # 取倒數第一個元素
li[-4:-2] == [9, 11] # 從倒數第四起,取-2-(-4)=2位元素
li[:-2] == li[-len(li):-2]
== [1,4,5,6,7,9,11] # 從頭開始,取-2-(-len(li))=7位元素
# 步長爲負數時,列表先翻轉,再截取
li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻轉整個列表
li[::-2] == [16,11,7,5,1] # 翻轉整個列表,再按2間隔過濾
li[:-5:-1] == [16,14,11,9] # 翻轉整個列表,取-5-(-len(li))=4位元素
li[:-5:-3] == [16,9] # 翻轉整個列表,取-5-(-len(li))=4位元素,再按3間隔過濾
# 切片的步長不可以爲0
li[::0] # 報錯(ValueError: slice step cannot be zero)
注意: 切片只是淺拷貝 ,它拷貝的是原列表中元素的引用,所以,當存在變長對象的元素時,新列表將受制於原列表。
# 切片列表受制於原列表
lo = [1,[1,1],2,3]
lp = lo[:2] # [1, [1, 1]]
lo[1].append(1) # [1, [1, 1, 1], 2, 3]
lp # [1, [1, 1, 1]]
索引與切片在類中的實現:
class Foo:
def __init__(self,name,age):
self.name = name
self.age = age
def __getitem__(self, item):
if isinstance(item,slice):
print("切片處理")
print('索引起始值:%d' % item.start)
print('索引截止值:%d' % item.stop)
if item.step:
print('索引步長值:%d' % item.step)
else:
print("索引處理")
print('索引值:%d' % item.start)
def __setitem__(self, key, value):
if isinstance(key, slice):
print("切片賦值處理")
print('索引起始值:%d' % key.start)
print('索引截止值:%d' % key.stop)
if key.step:
print('索引步長值:%d' % key.step)
else:
print("索引賦值處理")
def __delitem__(self, key):
if isinstance(key, slice):
print("切片刪除處理")
print('索引起始值:%d' % key.start)
print('索引截止值:%d' % key.stop)
if key.step:
print('索引步長值:%d' % key.step)
else:
print("索引刪除處理")
讀取大文件對象中給定行數範圍的數據,使用迭代器切片可以大大提升效率:
# test.txt 文件內容
'''
貓
Python貓
python is a cat.
this is the end.
'''
from itertools import islice
with open('test.txt','r',encoding='utf-8') as f:
print(hasattr(f, "__next__")) # 判斷是否迭代器
content = islice(f, 2, 4)
for line in content:
print(line.strip())
### 輸出結果:
True
python is a cat.
this is the end.