Swift 中的 Actors 使用以如何及防止數據競爭

Swift Actors 是Swift 5.5中的新內容,也是WWDC 2021上併發重大變化的一部分。在有 actors 之前,數據競爭是一個常見的意外情況。因此,在我們深入研究具有隔離和非隔離訪問的行爲體之前,最好先了解什麼是數據競爭,並瞭解當前你如何解決這些問題

Swift 中的 Actors 旨在完全解決數據競爭問題,但重要的是要明白,很可能還是會遇到數據競爭。本文將介紹 Actors 是如何工作的,以及你如何在你的項目中使用它們。

什麼是 Actors?

Swift 中的 Actor 並不新鮮:它們受到 Actor Model 的啓發,該模型將行爲視爲併發計算的通用基元。然後,SE-0306提案引入了 Actor,並解釋了它們解決了哪些問題:數據競爭。

當多個線程在沒有同步的情況下訪問同一內存,並且至少有一個訪問是寫的時候,就會發生數據競爭。數據競爭會導致不可預測的行爲、內存損壞、不穩定的測試和奇怪的崩潰。你可能會遇到無法解決的崩潰,因爲你不知道它們何時發生,如何重現它們,或者如何根據理論來修復它們。我的文章Thread Sanitizer explained: Data Races in Swift深入解釋瞭如何解決、發現和修復數據競爭。

Swift 中的 Actors 可以保護他們的狀態免受數據競爭的影響,並且使用它們可以讓編譯器在編寫應用程序時爲我們提供有用的反饋。此外,Swift 編譯器可以靜態地強制執行 Actors 附帶的限制,並防止對可變數據的併發訪問。

您可以使用 actor 關鍵字定義一個 Actor,就像您使用類或結構體一樣:

actor ChickenFeeder {
    let food = "worms"
    var numberOfEatingChickens: Int = 0
}

Actor 和其他 Swift 類型一樣,它們也可以有初始化器、方法、屬性和子標號,同時你也可以用協議和泛型來使用它們。此外,與結構體不同的是:當你定義的屬性需要手動定義時,actor 需要自定義初始化器。最後,重要的是要認識到 actor 是引用類型。

Actor 是引用類型,但與類相比仍然有所不同

Actor 是引用類型,簡而言之,這意味着副本引用的是同一塊數據。因此,修改副本也會修改原始實例,因爲它們指向同一個共享實例。你可以在我的文章Swift中的Struct與class的區別中瞭解更多這方面的信息。

然而,與類相比,Actor 有一個重要的區別:他們不支持繼承。

不支持繼承意味着不需要像便利初始化器和必要初始化器、重寫、類成員或openfinal語句等功能。

然而,最大的區別是由 Actor 的主要職責決定的,即隔離對數據的訪問。

Actors 如何通過同步來防止數據競爭

Actor 通過創建對其隔離數據的同步訪問來防止數據競爭。在Actors之前,我們會使用各種鎖來創建相同的結果。這種鎖的一個例子是併發調度隊列與處理寫訪問的屏障相結合。受我在Concurrent vs. Serial DispatchQueue: Concurrency in Swift explained一文中解釋的技術的啓發。我將向你展示使用 Actor 的前後對比。

在 Actor 之前,我們會創建一個線程安全的小雞餵食器,如下所示:

final class ChickenFeederWithQueue {
    let food = "worms"
    
    /// 私有支持屬性和計算屬性的組合允許同步訪問。
    private var _numberOfEatingChickens: Int = 0
    var numberOfEatingChickens: Int {
        queue.sync {
            _numberOfEatingChickens
        }
    }
    
    /// 一個併發的隊列,允許同時進行多次讀取。
    private var queue = DispatchQueue(label: "chicken.feeder.queue", attributes: .concurrent)
    
    func chickenStartsEating() {
        /// 使用柵欄阻止寫入時的讀取
        queue.sync(flags: .barrier) {
            _numberOfEatingChickens += 1
        }
    }
    
    func chickenStopsEating() {
        /// 使用柵欄阻止寫入時的讀取
        queue.sync(flags: .barrier) {
            _numberOfEatingChickens -= 1
        }
    }
}

正如你所看到的,這裏有相當多的代碼需要維護。在訪問非線程安全的數據時,我們必須仔細考慮自己使用隊列的問題。需要一個柵欄標誌來停止讀取並允許寫入。再一次,我們需要自己來處理這個問題,因爲編譯器並不強制執行它。最後,我們在這裏使用了一個DispatchQueue,但是經常有圍繞着哪個鎖是最好的爭論。

爲了看清這一點,我們可以使用我們先前定義的 Actor 小雞餵食器來實現上述例子:

actor ChickenFeeder {
    let food = "worms"
    var numberOfEatingChickens: Int = 0
    
    func chickenStartsEating() {
        numberOfEatingChickens += 1
    }
    
    func chickenStopsEating() {
        numberOfEatingChickens -= 1
    }
}

你會注意到的第一件事是,這個實例更簡單,更容易閱讀。所有與同步訪問有關的邏輯都被隱藏在Swift標準庫中的實現細節裏。然而,最有趣的部分發生在我們試圖使用或讀取任何可變屬性和方法的時候:

在訪問可變屬性 numberOfEatingChickens時,也會發生同樣的情況:

然而,我們被允許編寫以下代碼:

let feeder = ChickenFeeder()
print(feeder.food) 

我們的餵食器上的food屬性是不可變的,因此是線程安全的。沒有數據競爭的風險,因爲在讀取過程中,它的值不能從另一個線程中改變。

然而,我們的其他方法和屬性會改變一個引用類型的可變狀態。爲了防止數據競爭,需要同步訪問,允許按順序訪問。

使用async/await從 Actors 訪問數據

在 Swift 中,我們可以通過使用 await關鍵字來創建異步訪問:

let feeder = ChickenFeeder()
await feeder.chickenStartsEating()
print(await feeder.numberOfEatingChickens) // Prints: 1 

防止不必要的暫停

在上面的例子中,我們正在訪問我們 Actor 的兩個不同部分。首先,我們更新喫食的雞的數量,然後我們執行另一個異步任務,打印出喫食的雞的數量。每個await都會導致你的代碼暫停,以等待訪問。在這種情況下,有兩個暫停是有意義的,因爲兩部分其實沒有什麼共同點。然而,你需要考慮到可能有另一個線程在等待調用chickenStartsEating,這可能會導致在我們打印出結果的時候有兩隻喫食的雞。

爲了更好地理解這個概念,讓我們來看看這樣的情況:你想把操作合併到一個方法中,以防止額外的暫停。例如,設想在我們的 actor 中有一個通知方法,通知觀察者有一隻新的雞開始喫東西:

extension ChickenFeeder {
    func notifyObservers() {
        NotificationCenter.default.post(name: NSNotification.Name("chicken.started.eating"), object: numberOfEatingChickens)
    }
} 

我們可以通過使用 await 兩次來使用此代碼:

let feeder = ChickenFeeder()
await feeder.chickenStartsEating()
await feeder.notifyObservers() 

然而,這可能會導致兩個暫停點,每個await都有一個。相反,我們可以通過從chickenStartsEating中調用notifyObservers方法來優化這段代碼:

func chickenStartsEating() {
    numberOfEatingChickens += 1
    notifyObservers()
} 

由於我們已經在Actor內有了同步的訪問,我們不需要另一個等待。這些都是需要考慮的重要改進,因爲它們可能會對性能產生影響。

Actor 內的非隔離(nonisolated)訪問

瞭解 Actor 內部的隔離概念很重要。上面的例子已經展示瞭如何通過要求使用 await 從外部參與者實例同步訪問。但是,如果您仔細觀察,您可能已經注意到我們的 notifyObservers 方法不需要使用 await 來訪問我們的可變屬性 numberOfEatingChickens

當訪問 Actor 中的隔離方法時,你基本上可以訪問任何其他需要同步訪問的屬性或方法。因此,你基本上是在重複使用你給定的訪問,以獲得最大的收益。

然而,在有些情況下,你知道不需要有隔離的訪問。actor 中的方法默認是隔離的。下面的方法只訪問我們的不可變的屬性food,但仍然需要await訪問它:

let feeder = ChickenFeeder()
await feeder.printWhatChickensAreEating() 

這很奇怪,因爲我們知道,我們不訪問任何需要同步訪問的東西。SE-0313的引入正是爲了解決這個問題。我們可以用nonisolated關鍵字標記我們的方法,告訴 Swift編 譯器我們的方法沒有訪問任何隔離數據:

extension ChickenFeeder {
    nonisolated func printWhatChickensAreEating() {
        print("Chickens are eating \(food)")
    }
}

let feeder = ChickenFeeder()
feeder.printWhatChickensAreEating() 

注意,你也可以對計算的屬性使用nonisolated的關鍵字,這對實現CustomStringConvertible等協議很有幫助:

extension ChickenFeeder: CustomStringConvertible {   
    nonisolated var description: String {     
        "A chicken feeder feeding \(food)"   
    } 
}

然而,在不可變的屬性上定義它們是不需要的,因爲編譯器會告訴你:

爲什麼在使用 Actors 時仍會出現數據競爭?

當在你的代碼中持續使用 Actors 時,你肯定會降低遇到數據競爭的風險。創建同步訪問可以防止與數據競爭有關的奇怪崩潰。然而,你顯然需要持續地使用它們來防止你的應用程序中出現數據競爭。

在你的代碼中仍然可能出現競爭條件,但可能不再導致異常。認識到這一點很重要,因爲Actors 畢竟被宣揚爲可以解決一切問題的工具。例如,想象一下兩個線程使用 await正確地訪問我們的 Actor 的數據:

queueOne.async {
    await feeder.chickenStartsEating()
}
queueTwo.async {
    print(await feeder.numberOfEatingChickens)
} 

這裏的競爭條件定義爲:“哪個線程將首先開始隔離訪問?”。所以基本上有兩種結果:

  • 隊列一在先,增加喫食的雞的數量。隊列二將打印:1
  • 隊列二在先,打印出喫食的雞的數量,該數量仍爲:0

這裏的不同之處在於我們在修改數據時不再訪問數據。如果沒有同步訪問,在某些情況下這可能會導致無法預料的行爲。

繼續你的Swift併發之旅

併發更改不僅僅是 async-await,還包括許多您可以在代碼中受益的新功能。所以當你在使用它的時候,爲什麼不深入研究其他併發特性呢?

結論

Swift Actors 解決了用 Swift 編寫的應用程序中常見的數據競爭問題。可變數據是同步訪問的,這確保了它是安全的。我們還沒有介紹 MainActor 實例,它本身就是一個主題。我將確保在以後的文章中介紹這一點。希望您能夠跟隨並知道如何在您的應用程序中使用 Actor。

轉自 Actors in Swift: how to use and prevent data races

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章