原创 MySQL數據庫——主從複製
目錄 一、主從複製的概念 二、主從複製的原理 1、主節點 binary log dump 線程 2、從節點I/O線程 3、從節點SQL線程 三、主從複製的用途 1、讀寫分離 2、 數據實時備份,當系統中某個節點發生故障時,可以方便的故障
原创 乾貨:解碼OneData,阿里的數倉之路。
目錄 一、起因 二、背景 1)數據標準不統一 2)服務業務能力 3)計算存儲成本 4)研發成本 三、他山之石——行業內是如何做的? 四、阿里的數倉模型體系要如何構建? 第一階段: 第二階段: 第三階段: 落地實現 A)數據規範定義 B)數
原创 Redis數據結構及對應使用場景,看一次就整明白了
目錄 Redis基礎數據結構有哪些? 一、String(字符串) 1、應用場景: 2、字符串(String)常用的命令: 二、list(列表) 1、應用場景: 2、list操作的常用命令: 三、hash (字典) 1、應用場景: 2、ha
原创 推薦系統的性能評估(RMSE、MAE、F1 core、A/B testing、CTR和CR、ROI和QA)
目錄 一、線下評估(應用學術研究) 1、RMSE(均方根誤差) 2、MAE(均方誤差) 3、F1 score(包括recall和precision) (1)recall (2)precision 4、A/B testing 二、線上評估(
原创 十、臨界資源和臨界區
一、臨界資源 在一段時間內只允許一個進程訪問的資源稱爲臨界資源(互斥共享)。 硬件資源如:打印機、磁帶機。 軟件資源如棧、變量、表格。 二、臨界區 每個進程中訪問臨界資源的那段代碼稱爲臨界區。 三、訪問的四個機制 1、空閒讓行 2、忙則等
原创 Mahout與機器學習
目錄 Mahout Mahout的特性 機器學習 實現機器學習的方式 1、監督學習(Supervised learning) 2、非監督學習(Unsupervised Learning) Mahout(象夫) Apache開源項目,主要
原创 五、特權指令和非特權指令
一、特權指令 特權指令是在系統態時運行的指令,是關係到全局的指令。 二、非特權指令 非特權指令是在用戶態運行的指令,一般應用程序所使用的都是非特權指令。 當應用程序中需要操作系統提供服務如請求I/O資源或執行I/O操作時,應用程序必
原创 數據管理技術的發展
數據管理技術的發展 1、人工管理階段(無獨立性) 特點: 數據不保存、應用程序管理數據、數據主要面向應用 2、文件管理階段(共享性差,冗餘度高) 特點: 數據可以放在文件中、通過文件系統管理數據、程序和數據有了一定的獨立性 3、數據庫系統
原创 排序算法————歸併排序
歸併排序原理 將兩個或兩個以上的有序表組合成一個新的有序表。 歸併排序舉例 原始序列:35 22 65 84 73 90 56 1、將原始序列看成7個子序列,則子序列有序。 子序列1:35 子序列2:22 子序列3:6
原创 排序算法————直接插入排序
直接插入排序原理 在每進行一趟排序期間,選取待排序列的第一個元素爲關鍵字,按照其關鍵字的數值大小 插入到已經排好的有序序列的適當位置,直至插入完成。 執行流程 原始序列: 1、取出51,一個數是有序的,所以51是有序序列。 2、插