原创 組複製官方文檔翻譯(組複製監控)

Monitoring Group Replication 如果mysql編譯了performance_schema,那麼可以使用Perfomance schema表監視組複製。組複製添加以下兩個新的P_S表: • performance_

原创 mongodb啓動很慢

故障現象 mongodb重啓後,等了幾十分鐘還一直沒啓動完成,單節點副本集,狀態一直處於startup 原因分析 查看mongod的錯誤日誌,發現一直處於building index,但根據之前的經驗,只有在重做secondary節點的時

原创 從最近的mysql故障談海量數據庫的備份系統設計

前言 最近爐石傳說,gitlab數據庫故障在業界傳得沸沸揚揚,造成了無法挽回的數據丟失。對於越是大規模的數據庫系統, 如何設計一個可靠的備份系統越是至關重要。本文主要以UCloud雲數據庫產品UDB的備份系統爲例,闡述下在海量數據庫情況下

原创 故障案例--mongo 3.0鑑權導致cpu居高不下

故障現象 CPU奇高,達到接近物理機核數上限; 錯誤日誌中的業務SQL執行較快,SQL不存在問題; 錯誤日誌大量的刷屏以下信息 原因分析 從錯誤日誌看,絕大部分情況都處於saslStart,查看資料發現這是mongo 3.0的鑑權機制正

原创 故障案例--mongo備份文件損壞,導致mongorestore中斷

故障現象 備份顯示成功,不過有次準備用這個備份恢復數據庫時,mongorestore卻失敗了,報錯如下  2017-05-11T23:52:48.050+0800  Progress: 348374754/1256078901 27%

原创 innodb獨立表空間模式下空洞問題研究

目錄 背景 空間空洞和碎片的定義及產生原因 碎片定義 碎片問題可能造成的影響 碎片和空間空洞的產生原因 空間空洞及碎片查看方法 MERGE_THRESHOLD innodb_fill_factor填充因子 測試詳情 測試前提條件和目的 前

原创 跨版本導入數據導致mysqld崩潰

現象 mysqld突然崩潰,錯誤日誌 Attempting backtrace. You can use the following information to find out where mysqld died. If you se

原创 mongos分片集羣下db數量過多導致服務不可用

故障現象 每隔一段時間發現mongos連不上,mongos日誌出現大量的socket連接錯誤 2017-08-08T17:09:31.095+0800 I SHARDING [conn52677] couldn't find databa

原创 mysql唯一索引的一個小常識--Duplicate entry 'XXX' for key 'XXX'

概述 之前一直有個小誤區,我以爲mysql的唯一索引肯定是區分大小寫的,然而實際上utf8字符集下,默認排序規則utf8_general_ci 情況下,是不區分大小寫的。而在排序規則utf8_bin下是區分大小寫的,這就有可能出現以下情況

原创 xtrabackup對於flush tables with read lock操作的設置

參數說明版本  percona-xtrabackup-2.4.8-Linux-x86_64 --kill-long-queries-timeout=N  指的是執行flush tables with read lock以後,如果flush

原创 利用mongosync做數據庫遷移

背景 有些情況下,官方推薦的遷移方法不是那麼便捷,比如mongos集羣的整體遷移步驟非常繁瑣,且對網絡的要求很高; mongosync支持mongos集羣遷移,目前支持3.0及以下版本,特別適合mongodb跨機房的遷移 目前有這麼一個需

原创 mongo3.0.9庫命名的一個S級bug

現象 db每隔一段時間崩潰一次,完全停服的情況下不會崩潰,mongod日誌如下 2018-01-16T20:21:43.573+0800 E STORAGE  [conn18] no cursor for uri: table:asd()

原创 xtrbackup限速測試