編寫高性能的 Swift 代碼

下面這篇文檔收集了一系列編寫高性能 Swift 代碼的要訣和技巧。文檔的目標讀者是編譯器和標準庫開發人員。

文檔中的一些技巧可以幫助提升您的 Swift 程序質量,使您的代碼不容易出錯且可讀性更好。顯式地標記最終類和類協議是兩個顯而易見的例子。 然而文檔中還有一些技巧是不符合規矩的,扭曲的,僅僅解決一些比編譯器或語言的特殊的臨時性需求。文檔中的很多建議來自於多方面的權衡,例如:運行時、字節大小、代碼可讀性等等。 

啓用優化

第一個應該做的事情就是啓用優化。Swift 提供了三種不同的優化級別:

  • -Onone: 這意味着正常的開發。它執行最小優化和保存所有調試信息。

  • -O: 這意味着對於大多數生產代碼。編譯器執行積極地優化,可以大大改變提交代碼的類型和數量。調試信息將被省略但還是會有損害的。

  • -Ounchecked: 這是一個特殊的優化模式,它意味着特定的庫或應用程序,這是以安全性來交換的。編譯器將刪除所有溢出檢查以及一些隱式類型檢查。這不是在通常情況下使用的,因爲它可能會導致內存安全問題和整數溢出。如果你仔細審查你的代碼,那麼對整數溢出和類型轉換來說是安全的。

在 Xcode UI 中,可以修改的當前優化級別如下: 
...

整個組件優化

默認情況下 Swift 單獨編譯每個文件。這使得 Xcode 可以非常快速的並行編譯多個文件。然而,分開編譯每個文件可以預防某些編譯器優化。Swift 也可以猶如它是一個文件一樣編譯整個程序,猶如就好像它是一個單一的編譯單元一樣優化這個程序。這個模式可以使用命令行 flag-whole-module-optimization 來激活。在這種模式下編譯的程序將最最有可能需要更長時間來編譯,單可以運行得更快。

這個模式可以通過 XCode 構建設置中的“Whole Module Optimization”來激活。

降低動態調度

Swift 在默認情況下是一個類似 Objective-C 的非常動態的語言。與 Objective-C 不同的是,Swift 給了程序員通過消除和減少這種特性來提供運行時性能的能力。本節提供幾個可被用於這樣的操作的語言結構的例子。

動態調度

類使用動態調度的方法和默認的屬性訪問。因此在下面的代碼片段中,a.aProperty、a.doSomething() 和 a.doSomethingElse() 都將通過動態調度來調用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
class A {
  var aProperty: [Int]
  func doSomething() { ... }
  dynamic doSomethingElse() { ... }
}
  
class B : A {
  override var aProperty {
    get { ... }
    set { ... }
  }
  
  override func doSomething() { ... }
}
  
func usingAnA(a: A) {
  a.doSomething()
  a.aProperty = ...
}

在 Swift 中,動態調度默認通過一個 vtable[1](虛函數表)間接調用。如果使用一個 dynamic 關鍵字來聲明,Swift 將會通過調用 Objective-C 通知來發送呼叫代替。這兩種情況中,這種情況會比直接的函數調用較慢,因爲它防止了對間接呼叫本身之外程序開銷的許多編譯器優化[2]。在性能關鍵的代碼中,人們常常會想限制這種動態行爲。

建議:當你知道聲明不需要被重寫時使用“final”。

final 關鍵字是一個類、一個方法、或一個屬性聲明中的一個限制,使得這樣的聲明不得被重寫。這意味着編譯器可以呼叫直接的函數調用代替間接調用。例如下面的 C.array1 和 D.array1 將會被直接[3]訪問。與之相反,D.array2 將通過一個虛函數表訪問: 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
final class C {
  // No declarations in class 'C' can be overridden.
  var array1: [Int]
  func doSomething() { ... }
}
  
class D {
  final var array1 [Int] // 'array1' cannot be overridden by a computed property.
  var array2: [Int]      // 'array2' *can* be overridden by a computed property.
}
  
func usingC(c: C) {
   c.array1[i] = ... // Can directly access C.array without going through dynamic dispatch.
   c.doSomething() = ... // Can directly call C.doSomething without going through virtual dispatch.
}
  
func usingD(d: D) {
   d.array1[i] = ... // Can directly access D.array1 without going through dynamic dispatch.
   d.array2[i] = ... // Will access D.array2 through dynamic dispatch.
}

建議:當聲明的東西不需要被文件外部被訪問到的時候,就用“private”

將 private 關鍵詞用在一個聲明上,會限制對其進行了聲明的文件的可見性。這會讓編輯器有能力甄別出所有其它潛在的覆蓋聲明。如此,由於沒有了任何這樣的聲明,使得編譯器可以自動地推斷出 final 關鍵詞,並據此去掉對方面的間接調用和屬性的訪問。例如在如下的 e.doSomething()  和 f.myPrivateVar 中,就將可以被直接訪問,假定在同一個文件中,E, F 並沒有任何覆蓋的聲明:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
private class E {
  func doSomething() { ... }
}
  
class F {
  private var myPrivateVar : Int
}
  
func usingE(e: E) {
  e.doSomething() // There is no sub class in the file that declares this class.
                  // The compiler can remove virtual calls to doSomething()
                  // and directly call A’s doSomething method.
}
  
func usingF(f: F) -> Int {
  return f.myPrivateVar
}

高效的使用容器類型

通用的容器 Array 和 Dictionary 是有 Swift 標準庫提供的一個重要的功能特性。本節將介紹如何用一種高性能的方式使用這些類型。

建議:在數組中使用值類型

在 Swift 中,類型可以分爲不同的兩類:值類型(結構體,枚舉,元組)和引用類型(類)。一個關鍵的區分是 NSArray 不能含有值類型。因此當使用值類型時,優化器就不需要去處理對 NSArray 的支持,從而可以在數組上省去大部分消耗。

此外,相比引用類型,如果值類型遞歸地含有引用類型,那麼值類型僅僅需要引用計數器。而如果使用沒有引用類型的值類型,就可以避免額外的開銷,從而釋放數組內的流量。  

1
2
3
4
5
6
7
// Don't use a class here.
struct PhonebookEntry {
  var name : String
  var number : [Int]
}
  
var a : [PhonebookEntry]

記住要在使用大值類型和使用引用類型之間做好權衡。在某些情況下,拷貝和移動大值類型數據的消耗要大於移除橋接和持有/釋放的消耗。

建議:當 NSArray 橋接不必要時,使用 ContiguousArray 存儲引用類型。
如果你需要一個引用類型的數組,而且數組不需要橋接到 NSArray 時,使用 ContiguousArray 替代 Array:
   

1
2
class C { ... }
var a: ContiguousArray = [C(...), C(...), ..., C(...)]

建議:使用適當的改變而不是對象分配。

在 Swift 中所有的標準庫容器都使用 COW(copy-on-write) 執行拷貝代替即時拷貝。在很多情況下,這可以讓編譯器通過持有容器而不是深度拷貝,從而省掉不必要的拷貝。如果容器的引用計數大於 1 並容器時被改變時,就會拷貝底層容器。例如:在下面這種情況:當 d 被分配給 c 時不拷貝,但是當 d 經歷了結構性的改變追加 2,那麼 d 將會被拷貝,然後 2 被追加到 b:

1
2
3
var c: [Int] = [ ... ]
var d = c        // No copy will occur here.
d.append(2)      // A copy *does* occur here.

如果用戶不小心時,有時 COW 會引起額外的拷貝。例如,在函數中,試圖通過對象分配執行修改。在 Swift 中,所有的參數傳遞時都會被拷貝一份,例如,參數在調用點之前持有一份,然後在調用的函數結束時釋放。也就是說,像下面這樣的函數:

1
2
3
4
5
6
7
func append_one(a: [Int]) -> [Int] {
  a.append(1)
  return a
}
  
var a = [1, 2, 3]
a = append_one(a)

儘管由於分配,a 的版本沒有任何改變 ,在 append_one 後也沒有使用 ,  但 a 也許會被拷貝。這可以通過使用 inout 參數來避免這個問題: 

1
2
3
4
5
6
func append_one_in_place(inout a: [Int]) {
  a.append(1)
}
  
var a = [1, 2, 3]
append_one_in_place(&a)

未檢查操作

Swift 通過在執行普通計算時檢查溢出的方法解決了整數溢出的 bug。這些檢查在已確定沒有內存安全問題會發生的高效的代碼中,是不合適的。

建議:當你確切的知道不會發生溢出時使用未檢查整型計算。

在對性能要求高的代碼中,如果你知道你的代碼是安全的,那麼你可以忽略溢出檢查。

1
2
3
4
5
6
7
8
a : [Int]
b : [Int]
c : [Int]
  
// Precondition: for all a[i], b[i]: a[i] + b[i] does not overflow!
for in 0 ... n {
  c[i] = a[i] &+ b[i]
}

泛型

Swift 通過泛型類型的使用,提供了一個非常強大的抽象機制 。Swift 編譯器發出一個可以對任何 T 執行 MySwiftFunc的具體的代碼塊。生成的代碼需要一個函數指針表和一個包含 T 的盒子作爲額外的參數。MySwiftFunc 和 MySwiftFunc之間的不同的行爲通過傳遞不同的函數指針表和通過盒子提供的抽象大小來說明。一個泛型的例子:

1
2
3
4
class MySwiftFunc { ... }
  
MySwiftFunc X    // Will emit code that works with Int...
MySwiftFunc Y // ... as well as String.

當優化器啓用時,Swift 編譯器尋找這段代碼的調用,並試着確認在調用中具體使用的類型(例如:非泛型類型)。如果泛型函數的定義對優化器來說是可見的,並知道具體類型,Swift 編譯器將生成一個有特殊類型的特殊泛型函數。那麼調用這個特殊函數的這個過程就可以避免關聯泛型的消耗。一些泛型的例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
class MyStack {
  func push(element: T) { ... }
  func pop() -> T { ... }
}
  
func myAlgorithm(a: [T], length: Int) { ... }
  
// The compiler can specialize code of MyStack[Int]
var stackOfInts: MyStack[Int]
// Use stack of ints.
for in ... {
  stack.push(...)
  stack.pop(...)
}
  
var arrayOfInts: [Int]
// The compiler can emit a specialized version of 'myAlgorithm' targeted for
// [Int]' types.
myAlgorithm(arrayOfInts, arrayOfInts.length)

建議:將泛型的聲明放在使用它的文件中

只有在泛型聲明在當前模塊可見的情況下優化器才能執行特殊化。這只有在使用泛型的代碼和聲明泛型的代碼在同一個文件中才能發生。注意標準庫是一個例外。在標準庫中聲明的泛型對所有模塊可見並可以進行特殊化。

建議:允許編譯器進行特殊化

只有當調用位置和被調函數位於同一個編譯單元的時候編譯器才能對泛型代碼進行特殊化。我們可以使用一個技巧讓編譯器對被調函數進行優化,這個技巧就是在被調函數所在的編譯單元中執行類型檢查。執行類型檢查的代碼會重新分發這個調用到泛型函數---可是這一次它攜帶了類型信息。在下面的代碼中,我們在函數 play_a_game 中插入了類型檢查,使得代碼的速度提高了幾百倍。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
//Framework.swift:
  
protocol Pingable { func ping() -> Self }
protocol Playable { func play() }
  
extension Int : Pingable {
  func ping() -> Int { return self + 1 }
}
  
class Game : Playable {
  var t : T
  
  init (_ v : T) {t = v}
  
  func play() {
    for in 0...100_000_000 { t = t.ping() }
  }
}
  
func play_a_game(game : Playable ) {
  // This check allows the optimizer to specialize the
  // generic call 'play'
  if let z = game as? Game {
    z.play()
  else {
    game.play()
  }
}
  
/// -------------- >8
  
// Application.swift:
  
play_a_game(Game(10)

大的值對象的開銷

在 swift 語言中,值類型保存它們數據獨有的一份拷貝。使用值類型有很多優點,比如值類型具有獨立的狀態。當我們拷貝值類型時(相當於複製,初始化參數傳遞等操作),程序會創建值類型的一個拷貝。對於大的值類型,這種拷貝時很耗費時間的,可能會影響到程序的性能。

讓我們看一下下面這段代碼。這段代碼使用值類型的節點定義了一個樹,樹的節點包含了協議類型的其他節點,計算機圖形場景經常由可以使用值類型表示的實體以及形態變化,因此這個例子很有實踐意義

1
2
3
4
5
6
7
8
9
protocol P {}
struct Node : P {
  var left, right : P?
}
  
struct Tree {
  var node : P?
  init() { ... }
}

當樹進行拷貝時(參數傳遞,初始化或者賦值)整個樹都需要被複制.這是一項花銷很大的操作,需要很多的 malloc/free 調用以及以及大量的引用計數操作

然而,我們並不關係值是否被拷貝,只要在這些值還在內存中存在就可以。
建議:對大的值類型使用 COW(copy-on-write,寫時複製和數組有點類似)

減少複製大的值類型數據開銷的辦法時採用寫時複製行爲(當對象改變時才進行實際的複製工作)。最簡單的實現寫時複製的方案時使用已經存在的寫時複製的數據結構,比如數組。Swift 的數據是值類型,但是當數組作爲參數被傳遞時並不每次都進行復制,因爲它具有寫時複製的特性。

在我們的 Tree 的例子中我們通過將 tree 的內容包裝成一個數組來減少複製的代價。這個簡單的改變對我們 tree 數據結構的性能影響時巨大的,作爲參數傳遞數組的代價從 O(n) 變爲 O(1)。

1
2
3
4
5
6
struct tree : P {
  var node : [P?]
  init() {
    node = [ thing ]
  }
}

但是使用數組實現 COW 機制有兩個明顯的不足,第一個問題是數組暴露的諸如 append 以及 count 之類的方法在值包裝的上下文中沒有任何作用,這些方法使得引用類型的封裝變得棘手。也許我們可以通過創建一個封裝的結構體並隱藏這些不用的 API 來解決這個問題,但是卻無法解決第二個問題。第二個問題就是數組內部存在保證程序安全性的代碼以及和 OC 交互的代碼。Swift 要檢查給出的下表是否摟在數組的邊界內,當保存值的時候需要檢查是否需要擴充存儲空間。這些運行時檢查會降低速度。 

一個替代的方案是實現一個專門的使用 COW 機制的數據結構代替採用數組作爲值的封裝。構建這樣一個數據結構的示例如下所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
final class Ref {
  var val : T
  init(_ v : T) {val = v}
}
  
struct Box {
    var ref : Ref    init(_ x : T) { ref = Ref(x) }
  
    var value: T {
        get { return ref.val }
        set {
          if (!isUniquelyReferencedNonObjC(&ref)) {
            ref = Ref(newValue)
            return
          }
          ref.val = newValue
        }
    }
}

類型 Box 可以代替上個例子中的數組

不安全的代碼

Swift 語言的類都是採用引用計數進行內存管理的。Swift 編譯器會在每次對象被訪問的時候插入增加引用計數的代碼。例如,考慮一個遍歷使用類實現的一個鏈表的例子。遍歷鏈表是通過移動引用到鏈表的下一個節點來完成的:elem = elem.next,每次移動這個引用,Swift 都要增加 next 對象的引用計數並減少前一個對象的引用計數,這種引用計數代價昂貴但是隻要使用 swift 類就無法避免

1
2
3
4
5
final class Node {
 var next: Node?
 var data: Int
 ...
}

建議:使用未託管的引用避免引用計數的負荷

在效率至上的代碼中你可以選擇使用未託管的引用。Unmanaged結構體允許開發者對特別的引用關閉引用計數 

1
2
3
4
5
6
var Ref : Unmanaged = Unmanaged.passUnretained(Head)
  
while let Next = Ref.takeUnretainedValue().next {
  ...
  Ref = Unmanaged.passUnretained(Next)
}

協議

建議:將只有類實現的協議標記爲類協議

Swift 可以指定協議只能由類實現。標記協議只能由類實現的一個好處是編譯器可以基於這一點對程序進行優化。例如,ARC 內存管理系統能夠容易的持有(增加該對象的引用計數)如果它知道它正在處理一個類對象。如果編譯器不知道這一點,它就必須假設結構體也可以實現協議,那麼它就必須準備好持有或者釋放不同的數據結構,而這代價將會十分昂貴。

如果限制只能由類實現某協議那麼就標記該協議爲類協議以獲得更好的性能

1
protocol Pingable : class { func ping() -> Int }

腳註

【1】虛擬方法表或者 vtable 是被一個實例引用的一種包含類型方法地址的類型約束表。進行動態分發時,首先從對象中查找這張表然後查找表中的方法
【2】這是因爲編譯器並不知道那個具體的方法要被調用
【3】例如,直接加載一個類的字段或者直接調用一個方法
【4】解釋 COW 是什麼
【5】在特定情況下優化器能夠通過內聯和 ARC 優化技術移除 retain,release 因爲沒有引起復制

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章