原创 Tukey's Ninther - John Tukey's median of median(翻譯)

原文地址:http://www.johndcook.com/blog/2009/06/23/tukey-median-ninther/ Tukey’s “ninther” or “median of medians” procedure

原创 Hbase - 比較器、過濾器、過濾器的操作符

過濾器的操作符 LESS < LESS_OR_EQUAL <= EQUAL = NOT_EQUAL <> GREATER_OR_EQUAL >= GREATER > NO_OP no operation 比較器 BinaryCompar

原创 Java拾遺 - default關鍵字詳細介紹

什麼是default方法? Java 8發佈以後,可以給接口添加新方法,但是,接口仍然可以和它的實現類保持兼容。這非常重要,因爲你開發的類庫可能正在被多個開發者廣泛的使用着。而Java 8之前,在類庫中發佈了一個接口以後,如果在接口中添加

原创 MySQL 2002問題解決方案 - Can't connect to local MySQL server through socket...

mysql,mysqldump,mysqldump,php連接mysql服務常會提示下面錯誤: ERROR 2002 (HY000): Can't connect to local MySQL server through socket

原创 PCA和線性迴歸

PCA與線性迴歸的根本差異在於: PCA中的誤差是點到直線的距離 即(cost = sqrt((x - x1)^2 + (y - y1)^2)) 線性迴歸中的誤差,體現在這個點在直線上的投影與原本點的“y”值之間的差異 即(cost

原创 Mongodb與Hbase的區別

1.Mongodb bson文檔型數據庫,整個數據都存在磁盤中,hbase是列式數據庫,集羣部署時每個familycolumn保存在單獨的hdfs文件中。 2.Mongodb 主鍵是“_id”,主鍵上面可以不建索引,記錄插入的順序和存放

原创 二叉樹常見問題

二叉樹的常見問題有如下幾個,如果解決好了,就跟鏈表一樣輕鬆:唯一不一樣的是,二叉樹是非線性結構。常見的問題如下: 二叉樹的問題 1.二叉樹三種周遊(traversal)方式: 2.怎樣從頂部開始逐層打印二叉樹結點數據 3.如何判斷

原创 HBase - 正確的Put方法

最近在做Hbase的一些操作,目的是利用Hbase建立一個支持高效地理索引的空間數據庫,在實踐中發現了一些問題,特地來這邊記錄下 Put的方法: 本人的實驗場景是Hbase 1.2.1 + Hadoop 2.6.3,算是比較新的版本了。

原创 JAVA拾遺 - 紅黑樹 Part I

寫在最前 紅黑樹,應該說是我們着一些年輕程序員最害怕的玩意了,每當宿舍吹比算法的時候,聊到樹,必然繞不開紅黑樹這個乖乖東西。 爲了達到二分查找的最佳性能,我們強調生成的二分查找樹必須是最“平衡”的,即所有從root點開始往下探的路徑長度,

原创 JAVA拾遺 - 如何正確地覆蓋equals方法

本文思想來自於Effective Java第二版 3.1章節,實爲閱讀總結,如果讀者有疑惑的地方強烈建議閱讀這個章節。 何時覆蓋Equals方法 何時不應該覆蓋 覆蓋equals方法看上去是一件簡單的事情,但是很多覆蓋的方法都會導致一些