原创 內存數據庫

目前在國內電信行業,內存數據庫已經是普遍使用了,特別是這次聯通BSS、OCS、電信OCS產品,基本都是集成了內存數據庫產品,其中主要是TT、altibase,似乎沒有IBM的solid的案例,此外華爲有自己的內存數據庫產品。  

原创 Java垃圾回收器

轉自csdn Java垃圾回收器是Java虛擬機(JVM)的三個重要模塊(另外兩個是解釋器和多線程機制)之一,爲應用程序提供內存的自動分配(Memory Allocation)、自動回收(Garbage Collect)功能,這兩個操

原创 Shark本地安裝及可能出現的問題

1.下載scala  wget http://www.scala-lang.org/files/archive/scala-2.9.3.tgz  最新有2.10.2.tgz文件  tar xvfz scala-2.9.3.tgz 

原创 hive:MoveTask

運行SQL時出了個錯: SQL: INSERT OVERWRITE DIRECTORY 'result/testConsole' select count(1) from nutable;  錯誤信息: Failed with ex

原创 Spark 0.9.1 MLLib 機器學習庫

翻譯自Spark官方文檔。by月禾 Spark 0.9.1 MLLib 機器學習庫簡介 依賴 二元分類 線性迴歸 聚類 協同過濾 隱性反饋 vs 顯性反饋 梯度下降基礎算法 用Scala調用MLLib 二元分類

原创 SQL之函數

一:函數         函數可以理解爲一種工具,用於完成定義明確的任務,如平方根、大小字母轉換等。         有些函數需要輸入參數,有些函數不需要輸入參數,但是函數必須具有返回值。         函數分爲確定性函數和非

原创 八種Docker容器開發模式

1. The Shared Base Container(s) Docker鼓勵“繼承”,這應用也很自然——這是高效使用Docker的一個基本方式,不僅由於它有助於減少建立新容器的時間,Docker優點多多,它會cache中間步驟,但

原创 歡迎使用CSDN-markdown編輯器

歡迎使用Markdown編輯器寫博客 本Markdown編輯器使用StackEdit修改而來,用它寫博客,將會帶來全新的體驗哦: Markdown和擴展Markdown簡潔的語法 代碼塊高亮 圖片鏈接和圖片上傳 LaTex數學公式 UM

原创 阿里雲關係型數據庫服務RDS

        關係型數據庫服務(Relational Database Service,簡稱RDS)是一種即開即用、穩定可靠、可彈性伸縮的在線數據庫服務。具有多重安全防護措施和完善的性能監控體系,並提供專業的數據庫備份、恢復及優化方案,

原创 讓hadoop遠程調試飛

讀hadoop源代碼時,經常需要調試源代碼。hadoop幾乎所有的進程的啓動最終全部依靠$HADOOP_HOME/bin/hadoop 腳本實現,開始就簡單的在需要的地方添加JDWP的debug選項,做的多了,感覺不夠自動化,簡單修改了

原创 Social Network 社交網絡分析

一:什麼是SNA-社交網絡分析 社交網絡分析的威力何在?我想幾個案例來說明。 案例1:對一個毫無瞭解的組織(這個組織可以是一個公司,亦或是一個組織),如果能夠拿到這個組織成員之間的信息流動記錄(例如通話記錄/或郵件記錄),那麼通過S

原创 apache kafka性能測試命令使用和構建kafka-perf

昨天在公司時,本來想用kafka官方提供的工具做性能測試的。但事與願違,當我執行官方提供的kafka測試腳本,卻報錯沒有找到ProducerPerformance,後來瀏覽一些代碼文件,才發現沒有把perf性能測試程序打包到kafka_

原创 馬雲大數據佈局

馬雲大數據佈局  當你明白何爲大數據,就知道這次馬雲又在佈一個很大的局,他也開始向大數據領域發力了。可以預料,大數據將會成爲未來產業財富擴張的重要引擎。   爲何大家對大數據表現出如此的激情呢? 看看外面精彩的世界便知一二。   大

原创 Partition深度解析&一致性hash

Hadoop中Partition深度解析 http://www.tuicool.com/articles/uaQVjqm 舊版 API 的 Partitioner 解析 Partitioner 的作用是對 Mapper 產生的中間結果

原创 詳細探究Spark的shuffle實現

Background 在MapReduce框架中,shuffle是連接Map和Reduce之間的橋樑,Map的輸出要用到Reduce中必須經過shuffle這個環節,shuffle的性能高低直接影響了整個程序的性能和吞吐量。Spark