前一篇文章《Golang併發模型:輕鬆入門流水線模型》,介紹了流水線模型的概念,這篇文章是流水線模型進階,介紹FAN-IN和FAN-OUT,FAN模式可以讓我們的流水線模型更好的利用Golang併發,提高軟件性能。但FAN模式不一定是萬能,不見得能提高程序的性能,甚至還不如普通的流水線。我們先介紹下FAN模式,再看看它怎麼提升性能的,它是不是萬能的。
這篇文章內容略多,本來打算分幾次寫的,但不如一次讀完爽,所以乾脆還是放一篇文章了,要是時間不充足,利用好碎片時間,可以每次看1個標題的內容。
FAN-IN和FAN-OUT模式
Golang的併發模式靈感來自現實世界,這些模式是通用的,毫無例外,FAN模式也是對當前世界的模仿。以汽車組裝爲例,汽車生產線上有個階段是給小汽車裝4個輪子,可以把這個階段任務交給4個人同時去做,這4個人把輪子都裝完後,再把汽車移動到生產線下一個階段。這個過程中,就有任務的分發,和任務結果的收集。其中任務分發是FAN-OUT,任務收集是FAN-IN。
- FAN-OUT模式:多個goroutine從同一個通道讀取數據,直到該通道關閉。OUT是一種張開的模式,所以又被稱爲扇出,可以用來分發任務。
- FAN-IN模式:1個goroutine從多個通道讀取數據,直到這些通道關閉。IN是一種收斂的模式,所以又被稱爲扇入,用來收集處理的結果。
FAN-IN和FAN-OUT實踐
我們這次試用FAN-OUT和FAN-IN,解決《Golang併發模型:輕鬆入門流水線模型》中提到的問題:計算一個整數切片中元素的平方值並把它打印出來。
-
producer()
保持不變,負責生產數據。 -
squre()
也不變,負責計算平方值。 - 修改
main()
,啓動3個square,這3個squre從producer生成的通道讀數據,這是FAN-OUT。 - 增加
merge()
,入參是3個square各自寫數據的通道,給這3個通道分別啓動1個協程,把數據寫入到自己創建的通道,並返回該通道,這是FAN-IN。
package main
import (
"fmt"
"sync"
)
func producer(nums ...int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for _, n := range nums {
out <- i
}
}()
return out
}
func square(inCh <-chan int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for n := range inCh {
out <- n * n
}
}()
return out
}
func merge(cs ...<-chan int) <-chan int {
out := make(chan int)
var wg sync.WaitGroup
collect := func(in <-chan int) {
defer wg.Done()
for n := range in {
out <- n
}
}
wg.Add(len(cs))
// FAN-IN
for _, c := range cs {
go collect(c)
}
// 錯誤方式:直接等待是bug,死鎖,因爲merge寫了out,main卻沒有讀
// wg.Wait()
// close(out)
// 正確方式
go func() {
wg.Wait()
close(out)
}()
return out
}
func main() {
in := producer(1, 2, 3, 4)
// FAN-OUT
c1 := square(in)
c2 := square(in)
c3 := square(in)
// consumer
for ret := range merge(c1, c2, c3) {
fmt.Printf("%3d ", ret)
}
fmt.Println()
}
3個squre協程併發運行,結果順序是無法確定的,所以你得到的結果,不一定與下面的相同。
➜ awesome git:(master) ✗ go run hi.go
1 4 16 9
FAN模式真能提升性能嗎?
相信你心裏已經有了答案,可以的。我們還是使用老問題,對比一下簡單的流水線和FAN模式的流水線,修改下代碼,增加程序的執行時間:
-
produer()
使用參數生成指定數量的數據。 -
square()
增加阻塞操作,睡眠1s,模擬階段的運行時間。 -
main()
關閉對結果數據的打印,降低結果處理時的IO對FAN模式的對比。
// hi_simple.go
package main
import (
"fmt"
)
func producer(n int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for i := 0; i < n; i++ {
out <- i
}
}()
return out
}
func square(inCh <-chan int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for n := range inCh {
out <- n * n
// simulate
time.Sleep(time.Second)
}
}()
return out
}
func main() {
in := producer(10)
ch := square(in)
// consumer
for _ = range ch {
}
}
使用FAN模式的流水線:
// hi_fan.go
package main
import (
"sync"
"time"
)
func producer(n int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for i := 0; i < n; i++ {
out <- i
}
}()
return out
}
func square(inCh <-chan int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for n := range inCh {
out <- n * n
// simulate
time.Sleep(time.Second)
}
}()
return out
}
func merge(cs ...<-chan int) <-chan int {
out := make(chan int)
var wg sync.WaitGroup
collect := func(in <-chan int) {
defer wg.Done()
for n := range in {
out <- n
}
}
wg.Add(len(cs))
// FAN-IN
for _, c := range cs {
go collect(c)
}
// 錯誤方式:直接等待是bug,死鎖,因爲merge寫了out,main卻沒有讀
// wg.Wait()
// close(out)
// 正確方式
go func() {
wg.Wait()
close(out)
}()
return out
}
func main() {
in := producer(10)
// FAN-OUT
c1 := square(in)
c2 := square(in)
c3 := square(in)
// consumer
for _ = range merge(c1, c2, c3) {
}
}
多次測試,每次結果近似,結果如下:
- FAN模式利用了7%的CPU,而普通流水線CPU只使用了3%,FAN模式能夠更好的利用CPU,提供更好的併發,提高Golang程序的併發性能。
- FAN模式耗時10s,普通流水線耗時4s。在協程比較費時時,FAN模式可以減少程序運行時間,同樣的時間,可以處理更多的數據。
➜ awesome git:(master) ✗ time go run hi_simple.go
go run hi_simple.go 0.17s user 0.18s system 3% cpu 10.389 total
➜ awesome git:(master) ✗
➜ awesome git:(master) ✗ time go run hi_fan.go
go run hi_fan.go 0.17s user 0.16s system 7% cpu 4.288 total
也可以使用Benchmark進行測試,看2個類型的執行時間,結論相同。爲了節約篇幅,這裏不再介紹,方法和結果貼在Gist了,想看的朋友瞄一眼,或自己動手搞搞。
FAN模式一定能提升性能嗎?
FAN模式可以提高併發的性能,那我們是不是可以都使用FAN模式?
不行的,因爲FAN模式不一定能提升性能。
依然使用之前的問題,再次修改下代碼,其他不變:
-
squre()
去掉耗時。 -
main()
增加producer()的入參,讓producer生產10,000,000個數據。
// hi_simple.go
func square(inCh <-chan int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for n := range inCh {
out <- n * n
}
}()
return out
}
func main() {
in := producer(10000000)
ch := square(in)
// consumer
for _ = range ch {
}
}
// hi_fan.go
package main
import (
"sync"
)
func square(inCh <-chan int) <-chan int {
out := make(chan int)
go func() {
defer close(out)
for n := range inCh {
out <- n * n
}
}()
return out
}
func main() {
in := producer(10000000)
// FAN-OUT
c1 := square(in)
c2 := square(in)
c3 := square(in)
// consumer
for _ = range merge(c1, c2, c3) {
}
}
結果,可以跑多次,結果近似:
➜ awesome git:(master) ✗ time go run hi_simple.go
go run hi_simple.go 9.96s user 5.93s system 168% cpu 9.424 total
➜ awesome git:(master) ✗ time go run hi_fan.go
go run hi_fan.go 23.35s user 11.51s system 297% cpu 11.737 total
從這個結果,我們能看到2點。
- FAN模式可以提高CPU利用率。
- FAN模式不一定能提升效率,降低程序運行時間。
優化FAN模式
既然FAN模式不一定能提高性能,如何優化?
不同的場景優化不同,要依具體的情況,解決程序的瓶頸。
我們當前程序的瓶頸在FAN-IN,squre函數很快就完成,merge函數它把3個數據寫入到1個通道的時候出現了瓶頸,適當使用帶緩衝通道可以提高程序性能,再修改下代碼
-
merge()
中的out
修改爲:out := make(chan int, 100)
結果:
➜ awesome git:(master) ✗ time go run hi_fan_buffered.go
go run hi_fan_buffered.go 19.85s user 8.19s system 323% cpu 8.658 total
使用帶緩存通道後,程序的性能有了較大提升,CPU利用率提高到323%,提升了8%,運行時間從11.7降低到8.6,降低了26%。
FAN模式的特點很簡單,相信你已經掌握了,如果記不清了看這裏,本文所有代碼在該Github倉庫。
FAN模式很有意思,並且能提高Golang併發的性能,如果想以後運用自如,用到自己的項目中去,還是要寫寫自己的Demo,快去實踐一把。
下一篇,寫流水線中協程的“優雅退出”,歡迎關注。
如果這篇文章對你有幫助,請點個贊/喜歡,讓我知道我的寫作是有價值的,感謝。