go-zero微服務實戰系列(八、如何處理每秒上萬次的下單請求)

在前幾篇的文章中,我們花了很大的篇幅介紹如何利用緩存優化系統的讀性能,究其原因在於我們的產品大多是一個讀多寫少的場景,尤其是在產品的初期,可能多數的用戶只是過來查看商品,真正下單的用戶非常少。但隨着業務的發展,我們就會遇到一些高併發寫請求的場景,秒殺搶購就是最典型的高併發寫場景。在秒殺搶購開始後用戶就會瘋狂的刷新頁面讓自己儘早的看到商品,所以秒殺場景同時也是高併發讀場景。那麼應對高併發讀寫場景我們怎麼進行優化呢?

處理熱點數據

秒殺的數據通常都是熱點數據,處理熱點數據一般有幾種思路:一是優化,二是限制,三是隔離。

優化

優化熱點數據最有效的辦法就是緩存熱點數據,我們可以把熱點數據緩存到內存緩存中。

限制

限制更多的是一種保護機制,當秒殺開始後用戶就會不斷地刷新頁面獲取數據,這時候我們可以限制單用戶的請求次數,比如一秒鐘只能請求一次,超過限制直接返回錯誤,返回的錯誤儘量對用戶友好,比如 "店小二正在忙" 等友好提示。

隔離

秒殺系統設計的第一個原則就是將這種熱點數據隔離出來,不要讓1%的請求影響到另外的99%,隔離出來後也更方便對這1%的請求做針對性的優化。具體到實現上,我們需要做服務隔離,即秒殺功能獨立爲一個服務,通知要做數據隔離,秒殺所調用的大部分是熱點數據,我們需要使用單獨的Redis集羣和單獨的Mysql,目的也是不想讓1%的數據有機會影響99%的數據。

流量削峯

針對秒殺場景,它的特點是在秒殺開始那一剎那瞬間湧入大量的請求,這就會導致一個特別高的流量峯值。但最終能夠搶到商品的人數是固定的,也就是不管是100人還是10000000人發起請求的結果都是一樣的,併發度越高,無效的請求也就越多。但是從業務角度來說,秒殺活動是希望有更多的人來參與的,也就是秒殺開始的時候希望有更多的人來刷新頁面,但是真正開始下單時,請求並不是越多越好。因此我們可以設計一些規則,讓併發請求更多的延緩,甚至可以過濾掉一些無效的請求。

削峯本質上是要更多的延緩用戶請求的發出,以便減少和過濾掉一些無效的請求,它遵從請求數要儘量少的原則。我們最容易想到的解決方案是用消息隊列來緩衝瞬時的流量,把同步的直接調用轉換成異步的間接推送,中間通過一個隊列在一端承接瞬時的流量洪峯,在另一端平滑的將消息推送出去,如下圖所示:

採用消息隊列異步處理後,那麼秒殺的結果是不太好同步返回的,所以我們的思路是當用戶發起秒殺請求後,同步返回響應用戶 "秒殺結果正在計算中..." 的提示信息,當計算完之後我們如何返回結果給用戶呢?其實也是有多種方案的。

  • 一是在頁面中採用輪詢的方式定時主動去服務端查詢結果,例如每秒請求一次服務端看看有沒有處理結果,這種方式的缺點是服務端的請求數會增加不少。
  • 二是主動push的方式,這種就要求服務端和客戶端保持長連接了,服務端處理完請求後主動push給客戶端,這種方式的缺點是服務端的連接數會比較多。

還有一個問題就是如果異步的請求失敗了該怎麼辦?我覺得對於秒殺場景來說,失敗了就直接丟棄就好了,最壞的結果就是這個用戶沒有搶到而已。如果想要儘量的保證公平的話,那麼失敗了以後也可以做重試。

如何保證消息只被消費一次

kafka是能夠保證"At Least Once"的機制的,即消息不會丟失,但有可能會導致重複消費,消息一旦被重複消費那麼就會造成業務邏輯處理的錯誤,那麼我們如何避免消息的重複消費呢?

我們只要保證即使消費到了重複的消息,從消費的最終結果來看和只消費一次的結果等同就好了,也就是保證在消息的生產和消費的過程是冪等的。什麼是冪等呢?如果我們消費一條消息的時候,要給現有的庫存數量減1,那麼如果消費兩條相同的消息就給庫存的數量減2,這就不是冪等的。而如果消費一條消息後處理邏輯是將庫存的數量設置爲0,或者是如果當前庫存的數量爲10時則減1,這樣在消費多條消息時所得到的結果就是相同的,這就是冪等的。說白了就是一件事無論你做多少次和做一次產生的結果都是一樣的,那麼這就是冪等性。

我們可以在消息被消費後,把唯一id存儲在數據庫中,這裏的唯一id可以使用用戶id和商品id的組合,在處理下一條消息之前先從數據庫中查詢這個id看是否被消費過,如果消費過就放棄。僞代碼如下:

isConsume := getByID(id)
if isConsume {
  return  
} 
process(message)
save(id)

還有一種方式是通過數據庫中的唯一索引來保證冪等性,不過這個要看具體的業務,在這裏不再贅述。

代碼實現

整個秒殺流程圖如下:

使用kafka作爲消息隊列,所以要先在本地安裝kafka,我使用的是mac可以用homebrew直接安裝,kafka依賴zookeeper也會自動安裝

brew install kafka

安裝完後通過brew services start啓動zookeeper和kafka,kafka默認偵聽在9092端口

brew services start zookeeper

brew services start kafka

seckill-rpc的SeckillOrder方法實現秒殺邏輯,我們先限制用戶的請求次數,比如限制用戶每秒只能請求一次,這裏使用go-zero提供的PeriodLimit功能實現,如果超出限制直接返回

code, _ := l.limiter.Take(strconv.FormatInt(in.UserId, 10))
if code == limit.OverQuota {
  return nil, status.Errorf(codes.OutOfRange, "Number of requests exceeded the limit")
}

接着查看當前搶購商品的庫存,如果庫存不足就直接返回,如果庫存足夠的話則認爲可以進入下單流程,發消息到kafka,這裏kafka使用go-zero提供的kq庫,非常簡單易用,爲秒殺新建一個Topic,配置初始化和邏輯如下:

Kafka:
  Addrs:
    - 127.0.0.1:9092
  SeckillTopic: seckill-topic
KafkaPusher: kq.NewPusher(c.Kafka.Addrs, c.Kafka.SeckillTopic)
p, err := l.svcCtx.ProductRPC.Product(l.ctx, &product.ProductItemRequest{ProductId: in.ProductId})
if err != nil {
  return nil, err
}
if p.Stock <= 0 {
  return nil, status.Errorf(codes.OutOfRange, "Insufficient stock")
}
kd, err := json.Marshal(&KafkaData{Uid: in.UserId, Pid: in.ProductId})
if err != nil {
  return nil, err
}
if err := l.svcCtx.KafkaPusher.Push(string(kd)); err != nil {
  return nil, err
}

seckill-rmq消費seckill-rpc生產的數據進行下單操作,我們新建seckill-rmq服務,結構如下:

tree ./rmq

./rmq
├── etc
│   └── seckill.yaml
├── internal
│   ├── config
│   │   └── config.go
│   └── service
│       └── service.go
└── seckill.go

4 directories, 4 files

依然是使用kq初始化啓動服務,這裏我們需要註冊一個ConsumeHand方法,該方法用以消費kafka數據

srv := service.NewService(c)
queue := kq.MustNewQueue(c.Kafka, kq.WithHandle(srv.Consume))
defer queue.Stop()

fmt.Println("seckill started!!!")
queue.Start()

在Consume方法中,消費到數據後先反序列化,然後調用product-rpc查看當前商品的庫存,如果庫存足夠的話我們認爲可以下單,調用order-rpc進行創建訂單操作,最後再更新庫存

func (s *Service) Consume(_ string, value string) error {
  logx.Infof("Consume value: %s\n", value)
  var data KafkaData
  if err := json.Unmarshal([]byte(value), &data); err != nil {
    return err
  }
  p, err := s.ProductRPC.Product(context.Background(), &product.ProductItemRequest{ProductId: data.Pid})
  if err != nil {
    return err
  }
  if p.Stock <= 0 {
    return nil
  }
  _, err = s.OrderRPC.CreateOrder(context.Background(), &order.CreateOrderRequest{Uid: data.Uid, Pid: data.Pid})
  if err != nil {
    logx.Errorf("CreateOrder uid: %d pid: %d error: %v", data.Uid, data.Pid, err)
    return err
  }
  _, err = s.ProductRPC.UpdateProductStock(context.Background(), &product.UpdateProductStockRequest{ProductId: data.Pid, Num: 1})
  if err != nil {
    logx.Errorf("UpdateProductStock uid: %d pid: %d error: %v", data.Uid, data.Pid, err)
    return err
  }
  // TODO notify user of successful order placement
  return nil
}

在創建訂單過程中涉及到兩張表orders和orderitem,所以我們要使用本地事務進行插入,代碼如下:

func (m *customOrdersModel) CreateOrder(ctx context.Context, oid string, uid, pid int64) error {
  _, err := m.ExecCtx(ctx, func(ctx context.Context, conn sqlx.SqlConn) (sql.Result, error) {
    err := conn.TransactCtx(ctx, func(ctx context.Context, session sqlx.Session) error {
      _, err := session.ExecCtx(ctx, "INSERT INTO orders(id, userid) VALUES(?,?)", oid, uid)
      if err != nil {
        return err
      }
      _, err = session.ExecCtx(ctx, "INSERT INTO orderitem(orderid, userid, proid) VALUES(?,?,?)", "", uid, pid)
      return err
    })
    return nil, err
  })
  return err
}

訂單號生成邏輯如下,這裏使用時間加上自增數進行訂單生成

var num int64

func genOrderID(t time.Time) string {
  s := t.Format("20060102150405")
  m := t.UnixNano()/1e6 - t.UnixNano()/1e9*1e3
  ms := sup(m, 3)
  p := os.Getpid() % 1000
  ps := sup(int64(p), 3)
  i := atomic.AddInt64(&num, 1)
  r := i % 10000
  rs := sup(r, 4)
  n := fmt.Sprintf("%s%s%s%s", s, ms, ps, rs)
  return n
}

func sup(i int64, n int) string {
  m := fmt.Sprintf("%d", i)
  for len(m) < n {
    m = fmt.Sprintf("0%s", m)
  }
  return m
}

最後分別啓動product-rpc、order-rpc、seckill-rpc和seckill-rmq服務還有zookeeper、kafka、mysql和redis,啓動後我們調用seckill-rpc進行秒殺下單

grpcurl -plaintext -d '{"user_id": 111, "product_id": 10}' 127.0.0.1:9889 seckill.Seckill.SeckillOrder

在seckill-rmq中打印了消費記錄,輸出如下

{"@timestamp":"2022-06-26T10:11:42.997+08:00","caller":"service/service.go:35","content":"Consume value: {\"uid\":111,\"pid\":10}\n","level":"info"}

這個時候查看orders表中已經創建了訂單,同時商品庫存減一

結束語

本質上秒殺是一個高併發讀和高併發寫的場景,上面我們介紹了秒殺的注意事項以及優化點,我們這個秒殺場景相對來說比較簡單,但其實也沒有一個通用的秒殺的框架,我們需要根據實際的業務場景進行優化,不同量級的請求優化的手段也不盡相同。這裏我們只展示了服務端的相關優化,但對於秒殺場景來說整個請求鏈路都是需要優化的,比如對於靜態數據我們可以使用CDN做加速,爲了防止流量洪峯我們可以在前端設置答題功能等等。

希望本篇文章對你有所幫助,謝謝。

每週一、週四更新

代碼倉庫: https://github.com/zhoushuguang/lebron

項目地址

https://github.com/zeromicro/go-zero

歡迎使用 go-zerostar 支持我們!

微信交流羣

關注『微服務實踐』公衆號並點擊 交流羣 獲取社區羣二維碼。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章