原创 組複製官方文檔翻譯(組複製監控)
Monitoring Group Replication 如果mysql編譯了performance_schema,那麼可以使用Perfomance schema表監視組複製。組複製添加以下兩個新的P_S表: • performance_
原创 mongodb啓動很慢
故障現象 mongodb重啓後,等了幾十分鐘還一直沒啓動完成,單節點副本集,狀態一直處於startup 原因分析 查看mongod的錯誤日誌,發現一直處於building index,但根據之前的經驗,只有在重做secondary節點的時
原创 從最近的mysql故障談海量數據庫的備份系統設計
前言 最近爐石傳說,gitlab數據庫故障在業界傳得沸沸揚揚,造成了無法挽回的數據丟失。對於越是大規模的數據庫系統, 如何設計一個可靠的備份系統越是至關重要。本文主要以UCloud雲數據庫產品UDB的備份系統爲例,闡述下在海量數據庫情況下
原创 故障案例--mongo 3.0鑑權導致cpu居高不下
故障現象 CPU奇高,達到接近物理機核數上限; 錯誤日誌中的業務SQL執行較快,SQL不存在問題; 錯誤日誌大量的刷屏以下信息 原因分析 從錯誤日誌看,絕大部分情況都處於saslStart,查看資料發現這是mongo 3.0的鑑權機制正
原创 故障案例--mongo備份文件損壞,導致mongorestore中斷
故障現象 備份顯示成功,不過有次準備用這個備份恢復數據庫時,mongorestore卻失敗了,報錯如下 2017-05-11T23:52:48.050+0800 Progress: 348374754/1256078901 27%
原创 innodb獨立表空間模式下空洞問題研究
目錄 背景 空間空洞和碎片的定義及產生原因 碎片定義 碎片問題可能造成的影響 碎片和空間空洞的產生原因 空間空洞及碎片查看方法 MERGE_THRESHOLD innodb_fill_factor填充因子 測試詳情 測試前提條件和目的 前
原创 跨版本導入數據導致mysqld崩潰
現象 mysqld突然崩潰,錯誤日誌 Attempting backtrace. You can use the following information to find out where mysqld died. If you se
原创 mongos分片集羣下db數量過多導致服務不可用
故障現象 每隔一段時間發現mongos連不上,mongos日誌出現大量的socket連接錯誤 2017-08-08T17:09:31.095+0800 I SHARDING [conn52677] couldn't find databa
原创 mysql唯一索引的一個小常識--Duplicate entry 'XXX' for key 'XXX'
概述 之前一直有個小誤區,我以爲mysql的唯一索引肯定是區分大小寫的,然而實際上utf8字符集下,默認排序規則utf8_general_ci 情況下,是不區分大小寫的。而在排序規則utf8_bin下是區分大小寫的,這就有可能出現以下情況
原创 xtrabackup對於flush tables with read lock操作的設置
參數說明版本 percona-xtrabackup-2.4.8-Linux-x86_64 --kill-long-queries-timeout=N 指的是執行flush tables with read lock以後,如果flush
原创 利用mongosync做數據庫遷移
背景 有些情況下,官方推薦的遷移方法不是那麼便捷,比如mongos集羣的整體遷移步驟非常繁瑣,且對網絡的要求很高; mongosync支持mongos集羣遷移,目前支持3.0及以下版本,特別適合mongodb跨機房的遷移 目前有這麼一個需
原创 mongo3.0.9庫命名的一個S級bug
現象 db每隔一段時間崩潰一次,完全停服的情況下不會崩潰,mongod日誌如下 2018-01-16T20:21:43.573+0800 E STORAGE [conn18] no cursor for uri: table:asd()