MySQL Memory 存儲引擎淺析

原創文章,轉載必需註明出處:http://www.cnblogs.com/wu-jian/

 

前言

需求源自項目中的MemCache需求,開始想用MemCached(官方網站:http://memcached.org/ ),但這個在Linux以下應用廣泛的開源軟件無官方支持的Windows版本號。後來看到博客園在用NorthScale Memcached Server(官方網站:http://www.couchbase.com/products-and-services/memcached)。貌似共享收費,又猶豫了。

事實上項目裏的需求非常easy,也想自己用.Net Cache來實現,但穩定性難以評估,開發維護成本又似乎太大,沒辦法。My SQL Memory Storage成了唯一選擇,由於差點兒不怎麼須要編寫代碼。

先看官方手冊,然後寫了個簡單的性能測試。由於官方最新的文檔都是英文版的,所以譯了5.5版本號 MySQL Memory Storage章節。

 

官方文檔(譯自5.5版本號的The Memory Storage Engine)

Memory存儲引擎將表的數據存放在內存中。Memory替代曾經的Heap成爲首選項。但同一時候向下兼容。Heap仍被支持。

Memory存儲引擎特性:

Storage limitsRAMTransactionsNoLocking granularityTable
MVCCNoGeospatial data type supportNoGeospatial indexing supportNo
B-tree indexesYesHash indexesYesFull-text search indexesNo
Clustered indexesNoData cachesN/AIndex cachesN/A
Compressed dataNoEncrypted dataYesCluster database supportNo
Replication supportYesForeign key supportNoBackup / point-in-time recoverycYes
Query cache supportYesUpdate statistics for data dictionaryYes  

Memory 與 MySQL Cluster的比較

希望部署內存引擎的開發人員們會考慮MySQL Cluster是否是更好的選擇,參考例如以下Memory引擎的使用場景及特點:

  • 能像會話(Session)或緩存(Caching)一樣方便操作和管理。
  • 充分發揮內存引擎的特點:快速度,低延遲。
  • 僅僅讀或讀爲主的訪問模式(不適合頻繁寫)。

可是內存表的性能受制於單線程的運行效率和寫操作時的表鎖開銷。這就限制了內存表高負載時的擴展性,特別是混合寫操作的併發處理。此外,內存表中的數據在server重新啓動後會丟失。

MySQL Cluster(集羣)支持與Memory引擎相同的功能而且提供更高的性能,同一時候擁有Memory不支持的很多其他其他功能:

  • 行鎖機制更好的支持多線程多用戶併發。
  • 更好的支持讀寫混合語句以及擴展。
  • 可選擇磁盤存儲介質永久保存數據。
  • Shared-nothing和分佈式架構保證無單點故障。99.999% 可用性。
  • 數據自己主動分佈在各個節點,應用開發人員無需考慮分區或分片解決方式。
  • 支持MEMORY中不支持的變長數據類型(包含BLOB 和 TEXT)。

關於MySQL集羣與Memory引擎很多其它細節方面的比較,能夠查看Scaling Web Services with MySQL Cluster: An Alternative to the MySQL Memory Storage Engine。該白皮書包含了這兩種技術的性能研究。並一步步指導你怎樣將Memory用戶遷移到MySQL集羣。

每一個Memory表和一個磁盤文件關聯起來。文件名稱由表的名字開始。而且由一個.frm的擴展名來指明它存儲的表定義。

要明白指出你想要一個Memory表。可使用ENGINE選項來指定:

CREATE TABLE t (i INT) ENGINE = MEMORY;

如它們名字所指明的,Memory表被存儲在內存中。且默認使用哈希索引。這使得它們很快,而且對創建暫時表很實用。但是。當server關閉之時,全部存儲在Memory表裏的數據被丟失。

由於表的定義被存在磁盤上的.frm文件裏,所以表自身繼續存在。在server重新啓動動時它們是空的。

這個樣例顯示你怎樣能夠創建。使用並刪除一個Memory表:

CREATE TABLE test ENGINE=MEMORY;
SELECT ip,SUM(downloads) AS down FROM log_table GROUP BY ip;
SELECT COUNT(ip),AVG(down) FROM test;
DROP TABLE test;

MEMORY表有下列特徵:

  • 給Memory表的空間被以小塊來分配。表對插入使用100%動態哈希來。不須要溢出區或額外鍵空間。自由列表無額外的空間需求。已刪除的行被放在一個以鏈接的列表裏,而且在你往表裏插入新數據之時被又一次使用。Memory表也沒有通常與在哈希表中刪除加插入相關的問題。
  • MEMORY表能夠有多達每一個表64個索引,每一個索引16列,以及3072字節的最大鍵長度。
  • MEMORY存儲引擎支持HASH和BTREE索引。你能夠通過加入一個例如以下所看到的的USING子句爲給定的索引指定一個或還有一個:
    複製代碼
    複製代碼
    CREATE TABLE lookup
    (id INT, INDEX USING HASH (id))
    ENGINE = MEMORY;
    CREATE TABLE lookup
    (id INT, INDEX USING BTREE (id))
    ENGINE = MEMORY;
    複製代碼
    複製代碼
  • 假設一個MEMORY 表的哈希索引鍵高度反覆 (很多索引條目包括同樣的值)。與索引鍵相關的更新以及全部的刪除將會明顯變慢。 反覆度與速度成正比,此時你可以使用BTREE 索引來避免這個問題。
  • MEMORY表可以使用非唯一鍵。

    (對哈希索引的實現,這是一個不經常使用的功能)

  • 對可包括NULL值的列的索引
  • MEMORY表使用固定的記錄長度格式。像VARCHAR這種可變長度類型將轉換爲固定長度類型在MEMORY表中存儲。
  • MEMORY不能包括BLOB或TEXT列.
  • MEMORY支持AUTO_INCREMENT列
  • MEMORY表支持INSERT DELAYED
  • 非暫時的MEMORY表在全部client之間共享。就像其他不論什麼非暫時表。
  • MEMORY表內容存儲在內存中,它會作爲動態查詢隊列創建內部暫時表的共享介質。可是兩個類型表的不同在於MEMORY表不會遇到存儲轉換,而內部表則會:
    1、MEMORY表不會轉換爲磁盤表,而內部暫時表假設太大會自己主動轉換爲磁盤表。


    2、MEMORY表最大值受系統變量 max_heap_table_size 限制,默覺得16MB,要改變MEMORY表限制大小,須要改變max_heap_table_size 的值。該值在 CREATE TABLE 時生效並伴隨表的生命週期,(當你使用 ALTER TABLE 或 TRUNCATE TABLE命令時,表的最大限制將改變。或重新啓動MYSQL服務時, 全部已存在的MEMORY表的最大限制將使用max_heap_table_size 的值重置。)

  • server須要足夠內存來維持全部在同一時間使用的MEMORY表。
  • 假設刪除行。內存表不會回收內存,僅僅有整張表全部刪除的時候。才進行內存回收。同一時候僅僅有在同一張表中插入新行時纔會使用之前刪除行的內存空間。 要釋放已刪除行所佔用的內存空間。能夠使用ALTER TABLE ENGINE=MEMORY對錶進行強制重建。當內容過期要釋放整張內存表。能夠運行DELETE 或 TRUNCATE TABLE清除全部行,或者使用DROP TABLE刪除表。
  • 當MySQLserver啓動時。假設你想填充MEMORY表,你能夠使用--init-file選項。比如。你能夠把INSERT INTO ... SELECT 或LOAD DATA INFILE這種語句放入這個文件裏以便從持久穩固的的數據源裝載表。
  • 假設你正使用複製,當主server被關閉且重新啓動動之時,主server的MEMORY表變空。但是從server意識不到這些表已經變空。所以假設你從它們選擇數據。它就返回過時的內容。

    自從server啓動後。當一個MEMORY表在主server上第一次被使用之時,一個DELETE FROM語句被自己主動寫進主server的二進制日誌,因此再次讓從server與主server同步。

    注意,即使使用這個策略,在主server的重新啓動和它第一次使用該表之間的間隔中,從server仍舊在表中有過時數據。但是,假設你使用--init-file選項於主server啓動之時在其上推行MEMORY表。它確保這個時間間隔爲零。

  • 在MEMORY表中,一行須要的內存使用下列公式計算:
    SUM_OVER_ALL_BTREE_KEYS(max_length_of_key + sizeof(char*) * 4)
    + SUM_OVER_ALL_HASH_KEYS(sizeof(char*) * 2)
    + ALIGN(length_of_row+1, sizeof(char*))

    ALIGN()代表round-up因子。它使得行的長度爲char指針大小的確切倍數。

    sizeof(char*)在32位機器上是4。在64位機器上是8。
    如前所述。系統變量 max_heap_table_size 用於設置內存表的大小上限。要控制單個表的最大值。須要在創建表之前設置會話變量。(不要設置全局max_heap_table_size 的值。除非你打算全部client創建的內存表都使用這個值)
    以下的樣例創建了兩張內存表,它們的限制大小分別爲 1MB 和 2MB:

    複製代碼
    複製代碼
    SET max_heap_table_size = 1024*1024;
    /* Query OK, 0 rows affected (0.00 sec) */
    
    CREATE TABLE t1 (id INT, UNIQUE(id)) ENGINE = MEMORY;
    /* Query OK, 0 rows affected (0.01 sec) */
    
    SET max_heap_table_size = 1024*1024*2;
    /* Query OK, 0 rows affected (0.00 sec) */
    
    CREATE TABLE t2 (id INT, UNIQUE(id)) ENGINE = MEMORY;
    /* Query OK, 0 rows affected (0.00 sec) */
    複製代碼
    複製代碼

    假設服務重新啓動,兩張表的限制大小會使用全局的max_heap_table_size值復原。
    你也能夠通過CREATE TABLE 的MAX_ROWS選項設置表的最大行數。但max_heap_table_size的優先級高於MAX_ROWS。當兩者同一時候存在時爲了最大兼容,你須要將max_heap_table_size設置一個合理值。

Memory存儲引擎官方論壇: http://forums.mysql.com/list.php?

92

 

性能測試

分別測試比較了MySQL的InnoDB、MyIsam、Memory三種引擎與.Net DataTable的Insert以及Select性能(柱狀圖體現了其消耗時間,單位百納秒。innodb_flush_log_at_trx_commit參數配置爲1,每次測試重新啓動了MySQL以避免Query Cache)。大至結果例如以下:

寫入10000條記錄比較。

讀取1000條記錄比較。

測試腳本:

複製代碼
複製代碼
/******************************************************
MYSQL STORAGE ENGINE TEST
http://wu-jian.cnblogs.com/
2011-11-29
******************************************************/


CREATE DATABASE IF NOT EXISTS test
    CHARACTER SET 'utf8'
    COLLATE 'utf8_general_ci';
USE test;


/******************************************************
1.INNODB
******************************************************/

DROP TABLE IF EXISTS test_innodb;
CREATE TABLE IF NOT EXISTS test_innodb (

    id                    INT UNSIGNED AUTO_INCREMENT                                COMMENT 'PK',
    obj                    CHAR(255) NOT NULL DEFAULT ''                            COMMENT 'OBJECT',

    PRIMARY KEY (id)

) ENGINE=INNODB;


/******************************************************
2.MYISAM
******************************************************/

DROP TABLE IF EXISTS test_myisam;
CREATE TABLE IF NOT EXISTS test_myisam (

    id                    INT UNSIGNED AUTO_INCREMENT                                COMMENT 'PK',
    obj                    CHAR(255) NOT NULL DEFAULT ''                            COMMENT 'OBJECT',

    PRIMARY KEY (id)

) ENGINE=MYISAM;


/******************************************************
1.MEMORY
******************************************************/

DROP TABLE IF EXISTS test_memory;
CREATE TABLE IF NOT EXISTS test_memory (

    id                    INT UNSIGNED AUTO_INCREMENT                                COMMENT 'PK',
    obj                    CHAR(255) NOT NULL DEFAULT ''                            COMMENT 'OBJECT',

    PRIMARY KEY (id)

) ENGINE=MEMORY;
複製代碼
複製代碼

測試代碼:

複製代碼
複製代碼
using System;
using System.Data;
using MySql.Data.MySqlClient;

namespace MySqlEngineTest
{
    class Program
    {
        const string OBJ = "The MEMORY storage engine creates tables with contents that are stored in memory. Formerly, these were known as HEAP tables. MEMORY is the preferred term, although HEAP remains supported for backward compatibility.";
        const string SQL_CONN = "Data Source=127.0.0.1;Port=3308;User ID=root;Password=root;DataBase=test;Allow Zero Datetime=true;Charset=utf8;pooling=true;";

        const int LOOP_TOTAL = 10000;
        const int LOOP_BEGIN = 8000;
        const int LOOP_END = 9000;

        #region Database Functions

        public static bool DB_InnoDBInsert(string obj)
        {
            string commandText = "INSERT INTO test_innodb (obj) VALUES (?

obj)"; MySqlParameter[] parameters = { new MySqlParameter("?

obj", MySqlDbType.VarChar, 255) }; parameters[0].Value = obj; if (DBUtility.MySqlHelper.ExecuteNonQuery(SQL_CONN, CommandType.Text, commandText, parameters) > 0) return true; else return false; } public static string DB_InnoDBSelect(int id) { string commandText = "SELECT obj FROM test_innodb WHERE id = ?id"; MySqlParameter[] parameters = { new MySqlParameter("?id", MySqlDbType.Int32) }; parameters[0].Value = id; return DBUtility.MySqlHelper.ExecuteScalar(SQL_CONN, CommandType.Text, commandText, parameters).ToString(); } public static bool DB_MyIsamInsert(string obj) { string commandText = "INSERT INTO test_myisam (obj) VALUES (?obj)"; MySqlParameter[] parameters = { new MySqlParameter("?obj", MySqlDbType.VarChar, 255) }; parameters[0].Value = obj; if (DBUtility.MySqlHelper.ExecuteNonQuery(SQL_CONN, CommandType.Text, commandText, parameters) > 0) return true; else return false; } public static string DB_MyIsamSelect(int id) { string commandText = "SELECT obj FROM test_myisam WHERE id = ?id"; MySqlParameter[] parameters = { new MySqlParameter("?id", MySqlDbType.Int32) }; parameters[0].Value = id; return DBUtility.MySqlHelper.ExecuteScalar(SQL_CONN, CommandType.Text, commandText, parameters).ToString(); } public static bool DB_MemoryInsert(string obj) { string commandText = "INSERT INTO test_memory (obj) VALUES (?obj)"; MySqlParameter[] parameters = { new MySqlParameter("?

obj", MySqlDbType.VarChar, 255) }; parameters[0].Value = obj; if (DBUtility.MySqlHelper.ExecuteNonQuery(SQL_CONN, CommandType.Text, commandText, parameters) > 0) return true; else return false; } public static string DB_MemorySelect(int id) { string commandText = "SELECT obj FROM test_memory WHERE id = ?id"; MySqlParameter[] parameters = { new MySqlParameter("?id", MySqlDbType.Int32) }; parameters[0].Value = id; return DBUtility.MySqlHelper.ExecuteScalar(SQL_CONN, CommandType.Text, commandText, parameters).ToString(); } #endregion #region Test Functions InnoDB static void InnoDBInsert() { long begin = DateTime.Now.Ticks; for (int i = 0; i < LOOP_TOTAL; i++) { DB_InnoDBInsert(OBJ); } Console.WriteLine("InnoDB Insert Result: {0}", DateTime.Now.Ticks - begin); } static void InnoDBSelect() { long begin = DateTime.Now.Ticks; for (int i = LOOP_BEGIN; i < LOOP_END; i++) { DB_InnoDBSelect(i); } Console.WriteLine("InnoDB SELECT Result: {0}", DateTime.Now.Ticks - begin); } static void MyIsamInsert() { long begin = DateTime.Now.Ticks; for (int i = 0; i < LOOP_TOTAL; i++) { DB_MyIsamInsert(OBJ); } Console.WriteLine("MyIsam Insert Result: {0}", DateTime.Now.Ticks - begin); } static void MyIsamSelect() { long begin = DateTime.Now.Ticks; for (int i = LOOP_BEGIN; i < LOOP_END; i++) { DB_MyIsamSelect(i); } Console.WriteLine("MyIsam SELECT Result: {0}", DateTime.Now.Ticks - begin); } static void MemoryInsert() { long begin = DateTime.Now.Ticks; for (int i = 0; i < LOOP_TOTAL; i++) { DB_MemoryInsert(OBJ); } Console.WriteLine("Memory Insert Result: {0}", DateTime.Now.Ticks - begin); } static void MemorySelect() { long begin = DateTime.Now.Ticks; for (int i = LOOP_BEGIN; i < LOOP_END; i++) { DB_MemorySelect(i); } Console.WriteLine("Memory SELECT Result: {0}", DateTime.Now.Ticks - begin); } static void DataTableInsertAndSelect() { //Insert DataTable dt = new DataTable(); dt.Columns.Add("id", Type.GetType("System.Int32")); dt.Columns["id"].AutoIncrement = true; dt.Columns.Add("obj", Type.GetType("System.String")); DataRow dr = null; long begin = DateTime.Now.Ticks; for (int i = 0; i < LOOP_TOTAL; i++) { dr = null; dr = dt.NewRow(); dr["obj"] = OBJ; dt.Rows.Add(dr); } Console.WriteLine("DataTable Insert Result: {0}", DateTime.Now.Ticks - begin); //Select long begin1 = DateTime.Now.Ticks; for (int i = LOOP_BEGIN; i < LOOP_END; i++) { dt.Select("id = " + i); } Console.WriteLine("DataTable Select Result: {0}", DateTime.Now.Ticks - begin1); } #endregion static void Main(string[] args) { InnoDBInsert(); InnoDBSelect(); //restart mysql to avoid query cache MyIsamInsert(); MyIsamSelect(); //restart mysql to avoid query cache MemoryInsert(); MemorySelect(); DataTableInsertAndSelect(); } }//end class}

複製代碼
複製代碼

 

總結

.Net Cache讀寫性能毫無疑問大大率先於數據庫引擎

InnoDB寫入耗時大概是MyIsam和Memory的5倍左右。它的行鎖機制必定決定了寫入時的很多其它性能開銷,而它的強項在於多線程的併發處理,而本測試未能體現其優勢。

三種數據庫引擎在SELECT性能上差點兒相同,Memory稍佔優,相同高併發下的比較有待進一步測試。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章