Golang 併發
有人把Go比作21世紀的C語言,第一是因爲Go語言設計簡單,第二,21世紀最重要的就是並行程序設計,而Go從語言層面就支持了並行。
goroutine
goroutine是Go並行設計的核心。goroutine說到底其實就是協程,但是它比線程更小,十幾個goroutine可能體現在底層就是五六個線程,Go語言內部幫你實現了這些goroutine之間的內存共享。執行goroutine只需極少的棧內存(大概是4~5KB),當然會根據相應的數據伸縮。也正因爲如此,可同時運行成千上萬個併發任務。goroutine比thread更易用、更高效、更輕便。
goroutine是通過Go的runtime管理的一個線程管理器。goroutine通過go
關鍵字實現了,其實就是一個普通的函數。
go hello(a, b, c)
通過關鍵字go就啓動了一個goroutine。我們來看一個例子
package main
import (
"fmt"
"runtime"
)
func say(s string) {
for i := 0; i < 5; i++ {
runtime.Gosched()
fmt.Println(s)
}
}
func main() {
go say("world") //開一個新的Goroutines執行
say("hello") //當前Goroutines執行
}
// 以上程序執行後將輸出:
// hello
// world
// hello
// world
// hello
// world
// hello
// world
// hello
我們可以看到go關鍵字很方便的就實現了併發編程。
上面的多個goroutine運行在同一個進程裏面,共享內存數據,不過設計上我們要遵循:不要通過共享來通信,而要通過通信來共享。
runtime.Gosched()表示讓CPU把時間片讓給別人,下次某個時候繼續恢復執行該goroutine。
默認情況下,在Go 1.5將標識併發系統線程個數的runtime.GOMAXPROCS的初始值由1改爲了運行環境的CPU核數。
但在Go 1.5以前調度器僅使用單線程,也就是說只實現了併發。想要發揮多核處理器的並行,需要在我們的程序中顯式調用 runtime.GOMAXPROCS(n) 告訴調度器同時使用多個線程。GOMAXPROCS 設置了同時運行邏輯代碼的系統線程的最大數量,並返回之前的設置。如果n < 1,不會改變當前設置。
channels
goroutine運行在相同的地址空間,因此訪問共享內存必須做好同步。那麼goroutine之間如何進行數據的通信呢,Go提供了一個很好的通信機制channel。channel可以與Unix shell 中的雙向管道做類比:可以通過它發送或者接收值。這些值只能是特定的類型:channel類型。定義一個channel時,也需要定義發送到channel的值的類型。注意,必須使用make 創建channel:
ci := make(chan int)
cs := make(chan string)
cf := make(chan interface{})
channel通過操作符<-
來接收和發送數據
ch <- v // 發送v到channel ch.
v := <-ch // 從ch中接收數據,並賦值給v
我們把這些應用到我們的例子中來:
package main
import "fmt"
func sum(a []int, c chan int) {
total := 0
for _, v := range a {
total += v
}
c <- total // send total to c
}
func main() {
a := []int{7, 2, 8, -9, 4, 0}
c := make(chan int)
go sum(a[:len(a)/2], c)
go sum(a[len(a)/2:], c)
x, y := <-c, <-c // receive from c
fmt.Println(x, y, x + y)
}
默認情況下,channel接收和發送數據都是阻塞的,除非另一端已經準備好,這樣就使得Goroutines同步變的更加的簡單,而不需要顯式的lock。所謂阻塞,也就是如果讀取(value := <-ch)它將會被阻塞,直到有數據接收。其次,任何發送(ch<-5)將會被阻塞,直到數據被讀出。無緩衝channel是在多個goroutine之間同步很棒的工具。
Buffered Channels
上面我們介紹了默認的非緩存類型的channel,不過Go也允許指定channel的緩衝大小,很簡單,就是channel可以存儲多少元素。ch:= make(chan bool, 4),創建了可以存儲4個元素的bool 型channel。在這個channel 中,前4個元素可以無阻塞的寫入。當寫入第5個元素時,代碼將會阻塞,直到其他goroutine從channel 中讀取一些元素,騰出空間。
ch := make(chan type, value)
當 value = 0 時,channel 是無緩衝阻塞讀寫的,當value > 0 時,channel 有緩衝、是非阻塞的,直到寫滿 value 個元素才阻塞寫入。
我們看一下下面這個例子,你可以在自己本機測試一下,修改相應的value值
package main
import "fmt"
func main() {
c := make(chan int, 2)//修改2爲1就報錯,修改2爲3可以正常運行
c <- 1
c <- 2
fmt.Println(<-c)
fmt.Println(<-c)
}
//修改爲1報如下的錯誤:
//fatal error: all goroutines are asleep - deadlock!
Range和Close
上面這個例子中,我們需要讀取兩次c,這樣不是很方便,Go考慮到了這一點,所以也可以通過range,像操作slice或者map一樣操作緩存類型的channel,請看下面的例子
package main
import (
"fmt"
)
func fibonacci(n int, c chan int) {
x, y := 1, 1
for i := 0; i < n; i++ {
c <- x
x, y = y, x + y
}
close(c)
}
func main() {
c := make(chan int, 10)
go fibonacci(cap(c), c)
for i := range c {
fmt.Println(i)
}
}
for i := range c
能夠不斷的讀取channel裏面的數據,直到該channel被顯式的關閉。上面代碼我們看到可以顯式的關閉channel,生產者通過內置函數close
關閉channel。關閉channel之後就無法再發送任何數據了,在消費方可以通過語法v, ok := <-ch
測試channel是否被關閉。如果ok返回false,那麼說明channel已經沒有任何數據並且已經被關閉。
記住應該在生產者的地方關閉channel,而不是消費的地方去關閉它,這樣容易引起panic
另外記住一點的就是channel不像文件之類的,不需要經常去關閉,只有當你確實沒有任何發送數據了,或者你想顯式的結束range循環之類的
Select
我們上面介紹的都是隻有一個channel的情況,那麼如果存在多個channel的時候,我們該如何操作呢,Go裏面提供了一個關鍵字select
,通過select
可以監聽channel上的數據流動。
select
默認是阻塞的,只有當監聽的channel中有發送或接收可以進行時纔會運行,當多個channel都準備好的時候,select是隨機的選擇一個執行的。
package main
import "fmt"
func fibonacci(c, quit chan int) {
x, y := 1, 1
for {
select {
case c <- x:
x, y = y, x + y
case <-quit:
fmt.Println("quit")
return
}
}
}
func main() {
c := make(chan int)
quit := make(chan int)
go func() {
for i := 0; i < 10; i++ {
fmt.Println(<-c)
}
quit <- 0
}()
fibonacci(c, quit)
}
在select
裏面還有default語法,select
其實就是類似switch的功能,default就是當監聽的channel都沒有準備好的時候,默認執行的(select不再阻塞等待channel)。
select {
case i := <-c:
// use i
default:
// 當c阻塞的時候執行這裏
}
超時
有時候會出現goroutine阻塞的情況,那麼我們如何避免整個程序進入阻塞的情況呢?我們可以利用select來設置超時,通過如下的方式實現:
func main() {
c := make(chan int)
o := make(chan bool)
go func() {
for {
select {
case v := <- c:
println(v)
case <- time.After(5 * time.Second):
println("timeout")
o <- true
break
}
}
}()
<- o
}
runtime goroutine
runtime包中有幾個處理goroutine的函數:
-
Goexit
退出當前執行的goroutine,但是defer函數還會繼續調用
-
Gosched
讓出當前goroutine的執行權限,調度器安排其他等待的任務運行,並在下次某個時候從該位置恢復執行。
-
NumCPU
返回 CPU 核數量
-
NumGoroutine
返回正在執行和排隊的任務總數
-
GOMAXPROCS
用來設置可以並行計算的CPU核數的最大值,並返回之前的值。