Azure步上了阿里雲、騰訊雲的“後塵”:這波流量太猛,扛不住了

隨着疫情的不斷蔓延,每個 IT 大廠都躲不過“流量突增”這一道題。

3 月 28 日,微軟在官方博客發文,透露了隨着全球疫情的不斷蔓延,當前 Microsoft Azure 的使用情況。

  • 在執行隔離措施的地區,Azure 雲服務的需求增加了 775%;

  • Teams(微軟提供的協作軟件)的使用率顯著增加,每天有超過 4400 萬用戶使用,在過去的一週內,用戶平均每天產生的會議和通話超過 9 億次;

  • Windows 虛擬桌面使用率增長了 3 倍以上;

  • 政府使用 Power BI 共享數據的 COVID-19 儀表板,在過去一週增加了 42%;

多名用戶吐槽 Azure 無法正常使用,Azure 疑似容量不足

3 月 24 日,宕機追蹤網站 Down Detector 報告了 Azure 英國地區的多個問題,不過,在官方的 Azure 頁面顯示是全部正常的。當然,無法提供資源不能算是中斷,但也會給用戶造成困擾,畢竟在備用 Azure 區域中,創建服務不一定是可行的,某些資源必須是在同一區域內創建,才能正常工作。

Azure 中斷似乎主要與容量有關

除了 Down Detector 報告,我們也看到了多位用戶吐槽自己的 Azure 服務不能正常使用了。

一位用戶在 Twitter 上發文稱,“Azure 似乎已經滿了!”根據推文的配圖來看,他正在嘗試爲 WVD 分配 VM,從命名 WVD-TEST-0 來看,這似乎是個測試部署,結果出現了錯誤,錯誤提示分配失敗,該地區沒有足夠的容量來容納請求的 VM 大小。該地區位於英國南部。

另外一位用戶也發文稱:“我昨天使用的虛擬機,今天已經無法啓動了,Azure Functions 也無法正常觸發了。”

有用戶解釋稱:“Azure Functions 雖然是Serverless,但是從用戶角度來看,仍然需要啓動一個 VM 來運行該功能,因此無法擺脫容量問題。與無法提供新資源相比,現有資源的不可靠性可能是一個更爲嚴重的問題。”

微軟回覆容量不足:會限制,但並未中斷服務

針對激增的流量,微軟也做出了部分迴應,並稱流量的增長不會對 Azure 產生負面影響。

爲了應對容量不足的問題,微軟採取了一些臨時限制措施,限制了免費提供,優先考慮現有客戶,對於新訂閱的某些資源也做了限制。用戶可以提出支持請求來增加容量,在不能滿足請求的情況下,微軟建議用戶使用需求量較少的替代區域,同時微軟也會在某些地區增加新的產能。

至於是否中斷服務,微軟迴應稱:“儘管需求顯著增加,但我們並未出現任何重大服務中斷。由於上週使用量激增,我們在某些地區(歐洲北部,歐洲西部,英國南部,法國中部,亞洲東部,印度南部,巴西南部)遇到了巨大需求,目前我們也在觀察在這些地區計算資源類型部署成功率低於 99.99% 的情況。”

“目前大部分部署仍然是可以成功的,如果用戶多次收到了分配失敗的提醒,我們也有相應的解決策略。我們把這些短期分配不足視爲服務事件,會通過 Azure Service Health 向受影響的客戶發送有針對性的更新和緩解指導。”

疫情衝擊,Facebook、Netflix、YouTube 紛紛降低畫質

受疫情影響,流量突增的不只是微軟 Azure,視頻網站也有同樣的經歷。爲了應對這一情況,多家擁有視頻業務的企業都選擇了降低視頻畫質。

3月19日,Netflix 發表聲明稱:在確保爲會員提供優質服務的前提,將歐洲地區的視頻內容碼率降低 1/4。視頻內容碼率的降低意味着視頻的清晰度會隨之降低。

3月20日,YouTube 發佈聲明稱:雖然到目前爲止,YouTube 上用量高峯的出現次數並不是很多,但爲了減少系統壓力,YouTube 還是決定採取措施,暫時將歐盟地區 (以及英國) 的所有默認清晰度設置爲標準清晰度,實施期限爲30天,之後會依據情況隨時調整。

3月22日,迪士尼宣佈:將於3月24日開始,降低整個歐洲地區的視頻碼率,以幫助在疫情期間控制互聯網流量。

3月24日,根據外媒報道,爲了緩解網絡擁堵,Facebook 將在拉丁美洲範圍內,降低其社交媒體平臺上(包括 Facebook 和 Instagram)的視頻清晰度,此前 Facebook 已經宣佈在歐洲採取了這個做法。

流量突增這道題,國內是怎麼答的?

因疫情原因導致流量突增,這道題國內企業也寫了,他們的答案是什麼呢?擴容!

我們以釘釘和騰訊會議爲例,講講他們的解題過程。

據瞭解,春節之後,超過 1000 萬組織和 2 億的上班族、5000 萬學生通過釘釘在線開工和學習。2月3號在線開工, 2月10號全國中小學在線開學, 2月17號全面復工復學,釘釘每週的流量都是前一週的 N 倍。

據瞭解,釘釘超預期的流量增加不是 3 倍、或 10 倍,而是 20 倍、上百倍,部分應用系統甚至達到了百倍以上。爲了保障登錄、消息收發等核心系統的通暢,釘釘對部分上下游系統實施流控的手段。並同時進行了全力擴容,據瞭解目前釘釘已連續在阿里雲擴容 10 萬多臺雲服務器。

同樣的流量增長也發生在了騰訊會議。當企業還沒復工的時候,騰訊以爲流量增長可能只是十倍或者百倍,復工一兩天之後,他們發現每天都是十倍十倍的增長,即使後來流量已經很高了,可仍舊在“翻倍”。

爲了支持這麼大的流量,從 1 月 29 日開始到 2 月 6 日,騰訊會議每天都在進行資源擴容,日均擴容雲主機接近 1.5 萬臺,8 天總共擴容超過 10 萬臺雲主機,共涉及超百萬核的計算資源投入。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章