原创 java I/O系統總結

參考了Thinking in java I/O部分,發現該書更多是從開發者原理性角度去描述I/O系統,這樣使得讓初學者不太好懂,後面我參考了“尚學堂”關於這部分視頻講解,感覺比較適合初學,有條理性、容易理解。 首先介紹關於流的概念,流比

原创 接口實現松耦合

來自java編程思想9.3 完全解耦 只要一個方法操作是類而非接口,那麼你就只能使用這個類及其子類。如果你想要將這個方法應用到不在此繼承結構中的某個類,那麼你就達不到目的。接口可以很大程度放寬這種限制,因此使用接口而非繼承使得我們可以編寫

原创 VisualSVN server配置及使用博客索引

start service failed解決辦法 這篇博客解決我們在安裝VisualSVN server中遇到的問題:Service 'VisualSVN Server' failed to start. Please check Vi

原创 使用odps 和 hive 後對數據庫與數據倉庫概念的理解

暑假實習使用了兩個月的odps ,回學校看了下hadoop 的hive ,讓我對數據庫與數據倉庫增進了一些理解,記錄下來。 簡而言之,數據庫是面向事務的設計,數據倉庫是面向主題設計的。 數據庫一般存儲在線交易數據,數據倉庫存儲的一般是歷

原创 環境配置記錄

eclipse工程紅色感嘆號: 原因:顯示紅色感嘆號是因爲jar包的路徑不對 解決:在項目上右擊Build Path -> Configure Build Paht...(或Propertise->Java Build Path)

原创 JUnit 4 使用教程

JUnit4是JUnit框架有史以來的最大改進,其主要目標便是利用Java5的Annotation特性簡化測試用例的編寫。 我們先看一下在JUnit 3中我們是怎樣寫一個單元測試的。比如下面一個類: package junit; pub

原创 斯坦福NG機器學習:K-means筆記

K-means 聚類算法: K-means聚類算法 算法流程,我們首先有訓練集,但是訓練集我們沒有類標籤,我們想把數據聚類成一些cluster ,這是一種無監督學習方法。具體步驟:1. 首先初始化cluster centroid 2.

原创 斯坦福NG機器學習課程:Dimensionality_reduction筆記

Dimensionality_reduction 首先通過圖形化描述引出爲什麼需要進行數據降維?以及數據降維的motivation。 Data compression Data compression 降低維度:好處減少計算機內存、磁盤

原创 python 排列相關問題小結

自己實現一個全排列python代碼: def perms(elements): if len(elements) <=1: yield elements else: for perm

原创 Matplotlib 工具包 使用教程索引

官方文檔鏈接中: http://matplotlib.org/gallery.html 這裏給了很多示例圖片,可以查看相應源代碼,是一個很好學習途徑。 matplotlib 函數API :函數API  入門參考博客:http://blog

原创 Hadoop 自定義數據類型和自定義排序

首先需要明確的一點就是在Hadoop 技術框架下 key 必須實現 WritableComparable 接口,而value必須實現 Writable 接口,下面舉兩個自定義數據類型來描述這個場景。 我們需要對某個流量端口文件進行流量統計

原创 斯坦福NG機器學習課程:Anomaly Detection筆記

Anomaly Detection Problem motivation: 首先描述異常檢測的例子:飛機發動機異常檢測 直觀上發現,如果新的發動機在中間,我們很大可能認爲是OK的,如果偏離很大,我們就需要更多檢測確定是否爲正常發動

原创 廣聯達2016西安研發筆試題

華爲機試考過的字符串壓縮問題,沒有難度。 給出了平衡二叉樹的概念,讓寫一個函數判斷是否爲平衡二叉樹。劍指offer書本的原題 方法一: struct BinaryTreeNode { int m_Value;

原创 python syntaxerror non ascii character xe5 in file

關於Python報錯:SyntaxError: Non-ASCII character '\xe5' in file的解決方法 首先想到是Eclipse 中設置Pydev編碼,嘗試了下面操作 我們都知道Win7默認編碼是GBK,而U

原创 斯坦福NG機器學習聽課筆記-推薦系統(recommender system)

推薦系統(recommender system) Problem Formulation: RecommenderSystems:爲什麼講它有兩個原因:首先它是一個很重要的機器學習應用方向,在很多公司中佔據了重要作用,像亞馬遜之類網站