文章目錄
線性表
定義
- 線性表(List):零個或多個數據元素的有限序列。
- 元素之間存在順序。若存在多個元素,則第一個元素無前驅,最後一個元素無後繼,其他元素有且只有一個前驅和後繼。
- 記法:若將線性表記爲,則稱是的直接前驅元素,是的直接後繼元素。當時,有且僅有一個直接後繼,當時,有且僅有一個直接前驅。
- 線性表元素的個數定義爲線性表的長度,當時,稱爲空表。
線性表的抽象數據類型(Abstract Data Type)
- 線性表的基本操作
ADT List:
List(self) #創建一個新表
is_empty(self) #判斷self是否是一個空表
len(self) #返回表長度
prepend(self,elem) #在表頭插入元素
append(self,elem) #在表尾加入元素
insert(self,elem,i) #在表的位置i處插入元素
pop(self) #刪除並彈出第一個元素
poplast(self) #刪除並彈出最後一個元素
del(self,i) #刪除並彈出第i個元素
get(self,i) #獲取第i個元素
count(self,elem) #統計元素出現的次數
index(self,elem) #查找元素在表中第一次出現的位置
forall(self,op) #對錶元素的遍歷操作,op操作
- 實現兩個線性表集合A和B的並集操作
def union(a, b):
```將所有在線性表b中但不在a中的數據元素插入到a中```
for i in range(len(b)):
x = b.get(i)
if a.count(x) == 0:
a.append(x)
return a
線性表的順序存儲結構
- 定義:用一段地址連續的存儲單元依次存儲線性表的數據元素。
- 順序存儲方式
- 使用一維數組來實現順序存儲結構
- 使用C語言進行順序存儲的結構代碼:
#define MAXSIZE 20 /*存儲空間初始分配量*/ typedef int ElemType; /*ElemType類型根據實際情況而定,這裏假設爲int*/ typedef struct { ElemType data[MAXSIZE]; /*數組存儲數據元素,最大值爲MAXSIZE*/ int length; /*線性表當前長度*/ }SqList;
- 順序存儲結構需要的三個屬性:
- 1.存儲空間的起始位置:數組
data
的存儲位置就是存儲空間的存儲位置 - 2.線性表的最大存儲容量:數組長度
Maxsize
- 3.線性表的當前長度:
length
- 1.存儲空間的起始位置:數組
- 數組長度與線性表長度
- 數組長度:存放線性表的存儲空間的長度,存儲分配後這個量一般是不變的。
- 線性表長度:線性表中數據元素的個數,隨着線性表插入和刪除操作而變化
- 在任意時刻,線性表的長度應該小於等於數組的長度
- 線性表的地址計算方法
- 由於數組下標從
0
開始,第i
個元素存儲在數組的下標爲i-1
的位置 - 存儲器中的每個存儲單元都有自己的編號,這個編號稱爲地址。
- 地址計算方式:假設每個數據元素佔用c個存儲空間
- 由於數組下標從
- 順序存儲結構的操作
由於Python
內部的tuple
和list
採用的就是順序存儲結構,不同點在於tuple
是固定結構,list
是可變動結構,具有線性表ADT
描述的全部操作,這裏只列舉列表list
的對象方法:
方法 | 說明 |
---|---|
list.append(x) | 在列表末尾添加元素,相當於a[len(a):] = [x] |
list.extend(iterable) | 使用可迭代對象的所有元素來擴展列表,相當於a[len(a):] = x |
list.insert(i, x) | 在指定位置插入元素x,在列表頭部插入x是a.insert(0, x),在列表尾部插入x是a.insert(len(a), x),相當於a.append(x) |
list.remove(x) | 移除列表中第一個值爲x的元素.如果沒有這樣的元素,則拋出ValueError異常. |
list.pop([i]) | 刪除列表中給定位置的元素並返回它.默認刪除並返回列表中的最後一個元素. |
list.clear() | 刪除列表中所有的元素,相當於del a[:] |
list.index(x[, start[, end]]) | 返回列表中第一個值爲x的元素從零開始的索引.如果沒有這樣的元素,則拋出ValueError異常.start和end可用於限制搜索範圍. |
list.count(x) | 返回元素x在列表中出現的次數. |
list.sort(key=None, reverse=False) | 對列表中的元素進行排序 |
list.reverse() | 反轉列表中的元素 |
list.copy() | 返回列表的一個淺拷貝,相當於a[:] |
- 不同操作的時間複雜度:
操作 | 時間複雜度 |
---|---|
append(x) | O(1) |
prepend(x) | O(1) |
insert(i,x) | O(n) |
pop() | O(1) |
poplast() | O(1) |
remove(i) | O(n) |
get(i) | O(1) |
count(x) | O(n) |
index(x) | O(n) |
- 優點:
- 無須爲表示表中元素之間的邏輯關係而增加額外的存儲空間
- 可以快速的存取表中任一位置的元素
- 缺點:
- 插入和刪除操作需要移動大量元素
- 當線性表長度變化較大時,難以確定存儲空間的容量
- 容易造成存儲空間的“碎片”
線性表的鏈式存儲結構
- 定義:用一組任意的存儲單元存儲線性表的數據元素。
- 對來說,除了存儲本身的信息之外,還需要存儲其直接後繼的存儲位置。我們將存儲數據元素信息的域稱爲數據域,將存儲直接後繼位置的域稱爲指針域。這兩部分信息構成了數據元素的存儲影像,稱爲結點(Node)。
- n個結點構成一個鏈表,即爲線性表的鏈式存儲結構。因爲此鏈表的每個結點只包含一個指針域,所以叫做單鏈表。單鏈表通過每個結點的指針域將線性表的數據元素按照其邏輯次序鏈接在一起。
- 我們將鏈表中第一個結點的存儲位置叫做頭指針,後面的每一個結點都是前一個結點的後繼指針指向的位置。而最後一個子結點指針爲空。
- 有時,爲了方便對鏈表進行操作,會在單鏈表的第一個結點前附設一個結點,稱爲頭結點。頭結點的數據域可以不存儲任何信息,也可以存儲如線性表的長度等附加信息。頭結點的指針域存儲指向第一個結點的指針。
- 頭指針與頭結點的區別
- 頭指針是鏈表的必要元素,是鏈表指向第一個結點的指針,具有標識作用,常用於表示鏈表的名字。
- 頭結點是爲了操作的統一和方便而設立的、放在第一元素的結點之前。頭結點的指針域存儲指向第一個結點的指針。有了頭結點,對在第一元素之前插入結點和刪除第一結點,其操作與其他結點的操作就統一了。
單鏈表(single linked list)
- 單鏈表結構:
- 不帶頭結點的單鏈表:
- 帶有頭結點的單鏈表:
- 不帶頭結點的單鏈表:
- 單鏈表的實現:見
LinkedList.py
中的LinkedList
類. - 單鏈表的改造
- 傳統的單鏈表訪問尾結點的時間複雜度爲O(n),爲了同時便於訪問頭結點和尾結點,可以添加一個指向尾結點的尾指針rear。實現見
LinkedList.py
中的_LinkedList
類.
- 傳統的單鏈表訪問尾結點的時間複雜度爲O(n),爲了同時便於訪問頭結點和尾結點,可以添加一個指向尾結點的尾指針rear。實現見
靜態鏈表 (static linked list)
- 定義:對於早期的高級編程語言,沒有指針的存在,人們使用數組代替指針來描述單鏈表。數組的每個下標對應一個data和cur。數據域data用來存放數據元素,遊標cur相當於單鏈表中的next指針,存放該元素的後繼在數組中的下標。我們把用數組描述的鏈表叫做靜態鏈表。
- 存儲結構:
- 實現:見
LinkedList.py
中的StaticLinkedList
類. - 優缺點:
循環鏈表(circular linked list)
- 定義:將單鏈表中終端結點的指針由空指針改爲指向頭結點,使整個單鏈表形成一個環,這種頭尾相接的單鏈表稱爲單循環鏈表,簡稱循環鏈表(circular linked list)。
- 循環鏈表使得可以從任意一個結點出發,訪問到鏈表的全部結點。
- 帶頭結點的頭指針非空循環鏈表結構:
- 循環鏈表和單鏈表的差異:
- 兩者對於循環的判斷條件不同。單鏈表若
p->next
爲空,則循環結束;循環鏈表若p->next
不等於頭結點,則循環未結束。
- 兩者對於循環的判斷條件不同。單鏈表若
- 循環鏈表的改造:
- 改造循環鏈表,不用頭指針,而是用指向終端結點的尾指針
rear
來表示循環鏈表,此時用rear->next->next
查找開始結點,用rear
查找終端結點,時間複雜度都爲O(1)
。 - 改造得到的帶頭結點的尾指針非空循環鏈表結構:
- 實現:見
03LinkedList.py
中的CirLinkedList
類.
- 改造循環鏈表,不用頭指針,而是用指向終端結點的尾指針
- 合併兩個循環鏈表
- 對循環鏈表加入尾指針後,很方便對多個循環鏈表進行合併,合併兩個循環鏈表的操作示意圖如下:
- 假設兩個循環鏈表的尾指針爲rearA和rearB,則合併操作如下:
p = rearA -> next
;rearA -> next = rearB -> next -> next
;rearB -> next = p
.
- Python實現:
def concated(a, b): p = a._rear.next a._rear.next = b._rear.next.next b._rear.next = p
- 對循環鏈表加入尾指針後,很方便對多個循環鏈表進行合併,合併兩個循環鏈表的操作示意圖如下:
雙向鏈表(double linked list)
-
定義:在單鏈表的每個結點中,再設置一個指向其前驅結點的指針域
prior
。 -
結構:
- 帶頭結點的雙向循環空鏈表:
- 非空的循環的帶頭結點的雙向鏈表
- 帶頭結點的雙向循環空鏈表:
-
與單鏈表的比較
- 求鏈表長度,查找元素,獲取元素位置等方法與單鏈表相同
- 插入和刪除操作需要更改兩個指針變量
-
插入操作示意圖:
s -> prior = p
s -> next = p -> next
p -> next -> prior = s
p -> next = s
-
刪除操作示意圖:
p -> prior -> next = p -> next
p -> next -> prior = p -> prior
-
實現:見
LinkedList.py
中的DoubleLinkedList
類.
鏈式存儲結構與順序存儲結構的比較
- 存儲分配方式
- 順序存儲結構用一段連續的存儲單元依次存儲線性表的數據元素
- 單鏈表採用鏈式存儲結構,用一組任意的存儲單元存放線性表的元素
- 時間性能
- 查找
- 順序存儲結構
O(1)
- 單鏈表
O(n)
- 順序存儲結構
- 插入和刪除
- 順序存儲結構需要平均移動表長一半的元素,時間爲
O(n)
- 單鏈表得到某結點的指針後,插入和刪除時間僅爲
O(1)
- 順序存儲結構需要平均移動表長一半的元素,時間爲
- 查找
- 空間性能
- 順序存儲結構需要預分配存儲空間,分大了浪費,分小了容易發生上溢
- 單鏈表不需要分配存儲空間,元素個數不受限制
- 結論:
- 對於需要頻繁查找、很少進行插入和刪除操作的線性表來說,宜採用順序存儲結構;若需要頻繁插入和刪除,宜採用單鏈表結構。
- 當線性表的元素個數變化較大或者不知道有多大時,宜採用單鏈表結構;若事先知道線性表的大致長度,宜採用順序存儲結構。