原创 數據庫事務隔離級別與封鎖協議

一、事務的4個基本特徵  1、原子性 (Atomicity )       要麼全執行,要麼都不執行。 2、一致性( Consistency )       事務在系統完整性中實施一致性,這通過保證系統的任何事務最後都處於有效狀態來實現

原创 Infobright comment lookup使用

前面的章節一直涉及到comment lookup,這裏將簡單介紹comment lookup的使用。   comment lookup只能顯式地使用在char或者varchar上面。Comment Lookup可以減少存儲空間,提高壓縮

原创 Infobright工作原理

前面已經簡要分析了Infobright的構架,現在來介紹Infobright的工作原理。   粗糙集(Rough Sets)是Infobright的核心技術之一。Infobright在執行查詢的時候會根據知識網絡(Knowledge G

原创 列式數據庫之infobright

infobright的優點有很多,簡單列舉如下:     Infobright的優點: (1)高壓縮比率 (2)快速響應複雜的分析查詢語句 (3)隨着數據庫的逐漸增大,查詢和裝載性能基本保持穩定

原创 Infobright構架分析

Infobright的總體構架圖如下:      如上圖所示,Infobright採用了和MySQL一致的構架,分爲兩層。上層是服務及應用管理,下層是存儲引擎。Infobright的默認存儲引擎是brighthouse,但是Infobr

原创 通過Map-Reduce實現Join系列之二

在本系列的第一篇中,介紹了幾種在數據庫應用中常見的Join算法,本文將會介紹兩種使用Map-Reduce實現對兩個數據集合進行Join的算法,其中的一種會用到第一篇中提到的哈希Join算法。這裏將這兩種方法分別命名爲Map-Reduce

原创 Infobright的數據類型

Infobright裏面支持所有的MySQL原有的數據類型。其中Integer類型比其他數據類型更加高效。儘可能使用以下的數據類型:   TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT   DECIMAL(儘

原创 通過Map-Reduce實現Join系列之四

在本系列的前面幾篇文章中,主要介紹了利用Map-Reduce任務來完成兩個或者多個文件的Join操作的一些算法和思路。基於的前提是對這些文件在相同的列上進行Join,本文將要討論如何通過Map-Reduce任務來完成對多個文件在不同列上

原创 深入JAVA虛擬機

判斷對象已經死的方法:1.引用計數法 2根搜索算法 GC Roots: 1 虛擬機棧(棧幀中的本地變量表)中的引用對象。  2 方法區中的類靜態屬性引用的對象。 3 方法區中的常量引用的對象。 4 本地方法棧中JNI(即一般說的Nati

原创 Nosql數據庫筆談

NoSQL數據庫筆談   序 思想篇CAP 最終一致性變體 BASE 其他I/O的五分鐘法則 不要刪除數據 RAM是硬盤,硬盤是磁帶 Amdahl定律和Gustafson定律 萬兆以太網 手段篇 一致性哈希亞馬遜的現狀

原创 Google Dremel 原理 – 如何能3秒分析1PB

來源:顏開的博客 簡介 Dremel 是Google 的“交互式”數據分析系統。可以組建成規模上千的集羣,處理PB級別的數據。MapReduce處理一個數據,需要分鐘級的時間。作爲MapReduce的發起人,Google開發了Dreme

原创 數據庫查詢的3個優化方法

  在優化查詢中,數據庫應用(如MySQL)即意味着對工具的操作與使用。使用索引、使用EXPLAIN分析查詢以及調整MySQL的內部配置可達到優化查詢的目的。   任何一位數據庫程序員都會有這樣的體會:高通信量的數據庫驅動程序中,

原创 MySQL Infobright-數據倉庫筆記

由於項目中的登錄log一直比較大,目前是每週切分一張表,每次做月季度數據分析的時候就很痛苦,今天特定請教了一下公司DBA的同學,學到了兩個解決方法。一個是把每天的登錄按照位運算的形式保存,查詢的時候使用bit_count(field)來

原创 MapReduce中的兩表join幾種方案簡介

1. 概述 在傳統數據庫(如:MYSQL)中,JOIN操作是非常常見且非常耗時的。而在HADOOP中進行JOIN操作,同樣常見且耗時,由於Hadoop的獨特設計思想,當進行JOIN操作時,有一些特殊的技巧。 本文首先介紹了Hadoop上

原创 spring security3.1開發樣例

Spring Security3的使用方法有4種:     一種是全部利用配置文件,將用戶、權限、資源(url)硬編碼在xml文件中。     二種是用戶和權限用數據庫存儲,而資源(url)和權限的對應採用硬編碼配置。     三種是細