2018年6月27日,某雲數據庫故障,起因:運維操作失誤觸發未知bug;
2018年7月17日,某雲管理控制檯間歇性失靈;
2018年7月18日,某雲平臺全局負載均衡服務發生中斷;
2018年7月20日,某雲北京三區雲硬盤IO異常,某創業公司數據全部丟失且無法恢復。
2018年7月24日,某雲廣州一區主備兩條網絡鏈路同時中斷。
最近各大公有云故障頻發,朋友圈又是哀嚎一片。面對宣傳時說“提供達 99.95 %的服務可用性和 99.9999999% 的數據可靠性”,出現故障時,我們就是那0.0000001%?
這些事故告訴了我們一個幾乎無法規避的現實,那就是最優秀的雲也會宕機,也會丟失數據。雖然雲計算提供了各種數據保護措施,但是依舊面臨諸多挑戰:數據安全、網絡連接以及數據備份等。讓我們不得不去反思面對這樣的不確定,我們應該怎麼辦?
1、對於普通業務,進行最低級別保護
採用雲主機快照+數據庫主從配置+數據庫異地備份的方式,保障核心數據。
(1)雲主機快照功能,對塊存儲的數據備份,當磁盤數據出現問題時,可以快速回滾。
(2)數據庫主從配置,解決單點問題,當主庫不可以用時,從庫接管服務。
(3)數據庫異地備份,通過互聯通雲專線將數據庫數據備份到異地數據中心,解決邏輯或者公有云其他因素導致的數據丟失等風險。
2、對於高可靠業務,進行高可用部署
將業務分別部署在同城不同數據中心。採用跨可用區的應用架構設計,讓應用服務輕鬆具備同城容災能力。
(1)當公有云故障時,利用DNS進行域名的快速切換,將業務流量導向災備中心,確保業務的可持續性
(2)將數據庫的主庫和從庫分別部署。當主庫所在公有云不可用時,可以快速切換到從庫所在災備數據中心,確保數據庫持續可用。
(3)利用互聯通雲專線,可以將公有云和容災數據中心實現私網IP互通,形成一張邏輯二層網,進行統一管理。
互聯通雲專線服務,是通過建立IDC與公有云之間的高速傳輸通道,爲客戶提供高速、穩定、安全的雲專線接入,構建雲網一體化。