編玩Go邊複習python系列:切片

文章目錄

本文主要介紹Go語言中切片(slice)及它的基本使用。

引子

因爲數組的長度是固定的並且數組長度屬於類型的一部分,所以數組有很多的侷限性。 例如:

func arraySum(x [3]int) int{
    sum := 0
    for _, v := range x{
        sum = sum + v
    }
    return sum
}

這個求和函數只能接受[3]int類型,其他的都不支持。 再比如:

a := [3]int{1, 2, 3}

數組a中已經有三個元素了,我們不能再繼續往數組a中添加新元素了。

切片

切片(Slice)是一個擁有相同類型元素的可變長度的序列。它是基於數組類型做的一層封裝。它非常靈活,支持自動擴容。

切片是一個引用類型,它的內部結構包含地址長度容量。切片一般用於快速地操作一塊數據集合。

切片的定義

聲明切片類型的基本語法如下:

var name []T

其中:

  • name:表示變量名
  • T:表示切片中的元素類型

舉個例子:

func main() {
	// 聲明切片類型
	var a []string              //聲明一個字符串切片
	var b = []int{}             //聲明一個整型切片並初始化
	var c = []bool{false, true} //聲明一個布爾切片並初始化
	var d = []bool{false, true} //聲明一個布爾切片並初始化
	fmt.Println(a)              //[]
	fmt.Println(b)              //[]
	fmt.Println(c)              //[false true]
	fmt.Println(a == nil)       //true
	fmt.Println(b == nil)       //false
	fmt.Println(c == nil)       //false
	// fmt.Println(c == d)   //切片是引用類型,不支持直接比較,只能和nil比較
}

| 切片的長度和容量

切片擁有自己的長度和容量,我們可以通過使用內置的len()函數求長度,使用內置的cap()函數求切片的容量。

| 切片表達式

切片表達式從字符串、數組、指向數組或切片的指針構造子字符串或切片。它有兩種變體:一種指定low和high兩個索引界限值的簡單的形式,另一種是除了low和high索引界限值外還指定容量的完整的形式。

簡單切片表達式

切片的底層就是一個數組,所以我們可以基於數組通過切片表達式得到切片。 切片表達式中的lowhigh表示一個索引範圍(左包含,又不包含),也就是下面代碼中從數組a中選出1<=索引值<4的元素組成切片s,得到的切片長度=high-low,容量等於得到的切片的底層數組的容量。

func main() {
	a := [5]int{1, 2, 3, 4, 5}
	s := a[1:3]  // s := a[low:high]
	fmt.Printf("s:%v len(s):%v cap(s):%v\n", s, len(s), cap(s))
}

輸出:

s:[2 3] len(s):2 cap(s):4

爲了方便起見,可以省略切片表達式中的任何索引。省略了low則默認爲0;省略了high則默認爲切片操作數的長度:

a[2:]  // 等同於 a[2:len(a)]
a[:3]  // 等同於 a[0:3]
a[:]   // 等同於 a[0:len(a)]

注意:

對於數組或字符串,如果0 <= low <= high <= len(a),則索引合法,否則就會索引越界(out of range)。

對切片再執行切片表達式時(切片再切片),high的上限邊界是切片的容量cap(a),而不是長度。常量索引 必須是非負的,並且可以用int類型的值表示;對於數組或常量字符串,常量索引也必須在有效範圍內。如果lowhigh兩個指標都是常數,它們必須滿足low <= high。如果索引在運行時超出範圍,就會發生運行時panic

func main() {
	a := [5]int{1, 2, 3, 4, 5}
	s := a[1:3]  // s := a[low:high]
	fmt.Printf("s:%v len(s):%v cap(s):%v\n", s, len(s), cap(s))
	s2 := s[3:4]  // 索引的上限是cap(s)而不是len(s)
	fmt.Printf("s2:%v len(s2):%v cap(s2):%v\n", s2, len(s2), cap(s2))
}

輸出:

s:[2 3] len(s):2 cap(s):4
s2:[5] len(s2):1 cap(s2):1

完整切片表達式

對於數組,指向數組的指針,或切片a(注意不能是字符串)支持完整切片表達式:

a[low : high : max]

上面的代碼會構造與簡單切片表達式a[low: high]相同類型、相同長度和元素的切片。另外,它會將得到的結果切片的容量設置爲max-low。在完整切片表達式中只有第一個索引值(low)可以省略;它默認爲0。

func main() {
	a := [5]int{1, 2, 3, 4, 5}
	t := a[1:3:5]
	fmt.Printf("t:%v len(t):%v cap(t):%v\n", t, len(t), cap(t))
}

輸出結果:

t:[2 3] len(t):2 cap(t):4

完整切片表達式需要滿足的條件是0 <= low <= high <= max <= cap(a),其他條件和簡單切片表達式相同。

| 使用make()函數構造切片

我們上面都是基於數組來創建的切片,如果需要動態的創建一個切片,我們就需要使用內置的make()函數,格式如下:

make([]T, size, cap)

其中:

  • T:切片的元素類型
  • size:切片中元素的數量
  • cap:切片的容量

舉個例子:

func main() {
	a := make([]int, 2, 10)
	fmt.Println(a)      //[0 0]
	fmt.Println(len(a)) //2
	fmt.Println(cap(a)) //10
}

上面代碼中a的內部存儲空間已經分配了10個,但實際上只用了2個。 容量並不會影響當前元素的個數,所以len(a)返回2,cap(a)則返回該切片的容量。

| 切片的本質

切片的本質就是對底層數組的封裝,它包含了三個信息:底層數組的指針、切片的長度(len)和切片的容量(cap)。

舉個例子,現在有一個數組a := [8]int{0, 1, 2, 3, 4, 5, 6, 7},切片s1 := a[:5],相應示意圖如下。
在這裏插入圖片描述
切片s2 := a[3:6],相應示意圖如下:
在這裏插入圖片描述
| 判斷切片是否爲空

要檢查切片是否爲空,請始終使用len(s) == 0來判斷,而不應該使用s == nil來判斷。

切片不能直接比較

切片之間是不能比較的,我們不能使用==操作符來判斷兩個切片是否含有全部相等元素。 切片唯一合法的比較操作是和nil比較。 一個nil值的切片並沒有底層數組,一個nil值的切片的長度和容量都是0。但是我們不能說一個長度和容量都是0的切片一定是nil,例如下面的示例:

var s1 []int         //len(s1)=0;cap(s1)=0;s1==nil
s2 := []int{}        //len(s2)=0;cap(s2)=0;s2!=nil
s3 := make([]int, 0) //len(s3)=0;cap(s3)=0;s3!=nil

所以要判斷一個切片是否是空的,要是用len(s) == 0來判斷,不應該使用s == nil來判斷。

切片的賦值拷貝

下面的代碼中演示了拷貝前後兩個變量共享底層數組,對一個切片的修改會影響另一個切片的內容,這點需要特別注意。

func main() {
	s1 := make([]int, 3) //[0 0 0]
	s2 := s1             //將s1直接賦值給s2,s1和s2共用一個底層數組
	s2[0] = 100
	fmt.Println(s1) //[100 0 0]
	fmt.Println(s2) //[100 0 0]
}
切片遍歷

切片的遍歷方式和數組是一致的,支持索引遍歷和for range遍歷。

func main() {
	s := []int{1, 3, 5}

	for i := 0; i < len(s); i++ {
		fmt.Println(i, s[i])
	}

	for index, value := range s {
		fmt.Println(index, value)
	}
}
append()方法爲切片添加元素

Go語言的內建函數append()可以爲切片動態添加元素。 可以一次添加一個元素,可以添加多個元素,也可以添加另一個切片中的元素(後面加…)

func main(){
	var s []int
	s = append(s, 1)        // [1]
	s = append(s, 2, 3, 4)  // [1 2 3 4]
	s2 := []int{5, 6, 7}  
	s = append(s, s2...)    // [1 2 3 4 5 6 7]
}

注意: 通過var聲明的零值切片可以在append()函數直接使用,無需初始化。

var s []int
s = append(s, 1, 2, 3)

沒有必要像下面的代碼一樣初始化一個切片再傳入append()函數使用,

s := []int{}  // 沒有必要初始化
s = append(s, 1, 2, 3)

var s = make([]int)  // 沒有必要初始化
s = append(s, 1, 2, 3)

每個切片會指向一個底層數組,這個數組的容量夠用就添加新增元素。當底層數組不能容納新增的元素時,切片就會自動按照一定的策略進行“擴容”,此時該切片指向的底層數組就會更換。“擴容”操作往往發生在append()函數調用時,所以我們通常都需要用原變量接收append函數的返回值。

舉個例子:

func main() {
	//append()添加元素和切片擴容
	var numSlice []int
	for i := 0; i < 10; i++ {
		numSlice = append(numSlice, i)
		fmt.Printf("%v  len:%d  cap:%d  ptr:%p\n", numSlice, len(numSlice), cap(numSlice), numSlice)
	}
}

輸出:

[0]  len:1  cap:1  ptr:0xc0000a8000
[0 1]  len:2  cap:2  ptr:0xc0000a8040
[0 1 2]  len:3  cap:4  ptr:0xc0000b2020
[0 1 2 3]  len:4  cap:4  ptr:0xc0000b2020
[0 1 2 3 4]  len:5  cap:8  ptr:0xc0000b6000
[0 1 2 3 4 5]  len:6  cap:8  ptr:0xc0000b6000
[0 1 2 3 4 5 6]  len:7  cap:8  ptr:0xc0000b6000
[0 1 2 3 4 5 6 7]  len:8  cap:8  ptr:0xc0000b6000
[0 1 2 3 4 5 6 7 8]  len:9  cap:16  ptr:0xc0000b8000
[0 1 2 3 4 5 6 7 8 9]  len:10  cap:16  ptr:0xc0000b8000

從上面的結果可以看出:

  1. append()函數將元素追加到切片的最後並返回該切片。
  2. 切片numSlice的容量按照1,2,4,8,16這樣的規則自動進行擴容,每次擴容後都是擴容前的2倍。

append()函數還支持一次性追加多個元素。 例如:

var citySlice []string
// 追加一個元素
citySlice = append(citySlice, "北京")
// 追加多個元素
citySlice = append(citySlice, "上海", "廣州", "深圳")
// 追加切片
a := []string{"成都", "重慶"}
citySlice = append(citySlice, a...)
fmt.Println(citySlice) //[北京 上海 廣州 深圳 成都 重慶]
切片的擴容策略

可以通過查看$GOROOT/src/runtime/slice.go源碼,其中擴容相關代碼如下:

newcap := old.cap
doublecap := newcap + newcap
if cap > doublecap {
	newcap = cap
} else {
	if old.len < 1024 {
		newcap = doublecap
	} else {
		// Check 0 < newcap to detect overflow
		// and prevent an infinite loop.
		for 0 < newcap && newcap < cap {
			newcap += newcap / 4
		}
		// Set newcap to the requested cap when
		// the newcap calculation overflowed.
		if newcap <= 0 {
			newcap = cap
		}
	}
}

從上面的代碼可以看出以下內容:

  • 首先判斷,如果新申請容量(cap)大於2倍的舊容量(old.cap),最終容量(newcap)就是新申請的容量(cap)。
  • 否則判斷,如果舊切片的長度小於1024,則最終容量(newcap)就是舊容量(old.cap)的兩倍,即(newcap=doublecap),
  • 否則判斷,如果舊切片長度大於等於1024,則最終容量(newcap)從舊容量(old.cap)開始循環增加原來的1/4,即(newcap=old.cap,for {newcap += newcap/4})直到最終容量(newcap)大於等於新申請的容量(cap),即(newcap >= cap)
  • 如果最終容量(cap)計算值溢出,則最終容量(cap)就是新申請容量(cap)。

需要注意的是,切片擴容還會根據切片中元素的類型不同而做不同的處理,比如intstring類型的處理方式就不一樣。

使用copy()函數複製切片

首先我們來看一個問題:

func main() {
	a := []int{1, 2, 3, 4, 5}
	b := a
	fmt.Println(a) //[1 2 3 4 5]
	fmt.Println(b) //[1 2 3 4 5]
	b[0] = 1000
	fmt.Println(a) //[1000 2 3 4 5]
	fmt.Println(b) //[1000 2 3 4 5]
}

由於切片是引用類型,所以a和b其實都指向了同一塊內存地址。修改b的同時a的值也會發生變化。

Go語言內建的copy()函數可以迅速地將一個切片的數據複製到另外一個切片空間中,copy()函數的使用格式如下:

copy(destSlice, srcSlice []T)

其中:

  • srcSlice: 數據來源切片
  • destSlice: 目標切片

舉個例子:

func main() {
	// copy()複製切片
	a := []int{1, 2, 3, 4, 5}
	c := make([]int, 5, 5)
	copy(c, a)     //使用copy()函數將切片a中的元素複製到切片c
	fmt.Println(a) //[1 2 3 4 5]
	fmt.Println(c) //[1 2 3 4 5]
	c[0] = 1000
	fmt.Println(a) //[1 2 3 4 5]
	fmt.Println(c) //[1000 2 3 4 5]
}
從切片中刪除元素

Go語言中並沒有刪除切片元素的專用方法,我們可以使用切片本身的特性來刪除元素。 代碼如下:

func main() {
	// 從切片中刪除元素
	a := []int{30, 31, 32, 33, 34, 35, 36, 37}
	// 要刪除索引爲2的元素
	a = append(a[:2], a[3:]...)
	fmt.Println(a) //[30 31 33 34 35 36 37]
}

總結一下就是:要從切片a中刪除索引爲index的元素,操作方法是a = append(a[:index], a[index+1:]…)

練習

  1. 請寫出下面代碼的輸出結果。
func main() {
	var a = make([]string, 5, 10)
	for i := 0; i < 10; i++ {
		a = append(a, fmt.Sprintf("%v", i))
	}
	fmt.Println(a)
}
  1. 請使用內置的sort包對數組var a = […]int{3, 7, 8, 9, 1}進行排序(附加題,自行查資料解答)。

【對比python】

切片是 Python 的一種高級特性,常用於截取序列類型的元素,但並不侷限於此,下面主要介紹了它的基礎用法、自定義對象切片、以及迭代器切片等使用內容。

索引與切片的基本使用:

li = [1, 4, 5, 6, 7, 9, 11, 14, 16]

# 以下寫法都可以表示整個列表,其中 X >= len(li)
li[0:X] == li[0:] == li[:X] == li[:] 
== li[::] == li[-X:X] == li[-X:]

li[1:5] == [4,5,6,7] # 從1起,取5-1位元素
li[1:5:2] == [4,6] # 從1起,取5-1位元素,按2間隔過濾
li[-1:] == [16] # 取倒數第一個元素
li[-4:-2] == [9, 11] # 從倒數第四起,取-2-(-4)=2位元素
li[:-2] == li[-len(li):-2] 
== [1,4,5,6,7,9,11] # 從頭開始,取-2-(-len(li))=7位元素

# 步長爲負數時,列表先翻轉,再截取
li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻轉整個列表
li[::-2] == [16,11,7,5,1] # 翻轉整個列表,再按2間隔過濾
li[:-5:-1] == [16,14,11,9] # 翻轉整個列表,取-5-(-len(li))=4位元素
li[:-5:-3] == [16,9] # 翻轉整個列表,取-5-(-len(li))=4位元素,再按3間隔過濾
# 切片的步長不可以爲0
li[::0]  # 報錯(ValueError: slice step cannot be zero)

注意: 切片只是淺拷貝 ,它拷貝的是原列表中元素的引用,所以,當存在變長對象的元素時,新列表將受制於原列表。

# 切片列表受制於原列表
lo = [1,[1,1],2,3]
lp = lo[:2] # [1, [1, 1]]
lo[1].append(1) # [1, [1, 1, 1], 2, 3]
lp # [1, [1, 1, 1]]

索引與切片在類中的實現:

class Foo:

    def __init__(self,name,age):
        self.name = name
        self.age = age

    def __getitem__(self, item):
        if isinstance(item,slice):
            print("切片處理")
            print('索引起始值:%d' % item.start)
            print('索引截止值:%d' % item.stop)
            if item.step:
                print('索引步長值:%d' % item.step)
        else:
            print("索引處理")
            print('索引值:%d' % item.start)

    def __setitem__(self, key, value):
        if isinstance(key, slice):
            print("切片賦值處理")
            print('索引起始值:%d' % key.start)
            print('索引截止值:%d' % key.stop)
            if key.step:
                print('索引步長值:%d' % key.step)
        else:
            print("索引賦值處理")

    def __delitem__(self, key):
        if isinstance(key, slice):
            print("切片刪除處理")
            print('索引起始值:%d' % key.start)
            print('索引截止值:%d' % key.stop)
            if key.step:
                print('索引步長值:%d' % key.step)
        else:
            print("索引刪除處理")

讀取大文件對象中給定行數範圍的數據,使用迭代器切片可以大大提升效率:

# test.txt 文件內容
'''
貓
Python貓
python is a cat.
this is the end.
'''

from itertools import islice
with open('test.txt','r',encoding='utf-8') as f:
    print(hasattr(f, "__next__"))  # 判斷是否迭代器
    content = islice(f, 2, 4)
    for line in content:
        print(line.strip())
### 輸出結果:
True
python is a cat.
this is the end.
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章