原创 Pydev 5.1.2 + Python 3.5.2 + Eclipse 4.4.2 搭配教程

本文主要搭建最新的Python 3.5.2 + Pydev 5.1.2,以及簡單的新建項目示例。 1 Eclipse安裝 l  自行上Eclipse官網下載最新的Eclipse 下載地址: http://www.oracle.com/te

原创 Eclipse Python 模板開發

在Eclipse中使用Template開發Python可以幫助我們省下很多開發的時間,具體步驟如下: l  新建開發模板 選擇Windows-performance l  填寫相關模板 填寫模板Name,Description,Pat

原创 數據結果和算法分析:散列和堆

散列 一般想法 散列函數 其中關係R爲散列函數 分離鏈接法  hash函數的運行時間爲O(1),所以插入和刪除都爲常量時間O(1)。(注意,插入和刪除都是以元素x而非關鍵字k作爲輸入,所以不用查找。) 接下來分析查找特定元素的性能。對

原创 Hadoop2.7 安裝

Hadoop2.7 安裝 參考:http://www.linuxidc.com/Linux/2015-01/112029.html 機器準備 192.168.72.130 master 192.168.72.131 slave1 192

原创 數據結構與算法分析:算法設計技巧

算法設計技巧 貪婪算法 顧名思義,貪心算法總是作出在當前看來最好的選擇。也就是說貪心算法並不從整體最優考慮,它所作出的選擇只是在某種意義上的局部最優選擇。當然,希望貪心算法得到的最終結果也是整體最優的。雖然貪心算法不能對所有問題都得到整體

原创 Scrapy簡介

Scrapy 框架 Scrapy,Python開發的一個快速,高層次的屏幕抓取和web抓取框架,用於抓取web站點並從頁面中提取結構化的數據。Scrapy用途廣泛,可以用於數據挖掘、監測和自動化測試。 Scrapy吸引人的地方在於它是一個

原创 Hadoop2.7.0安裝問題

Hadoop2.7.0安裝問題 HDFS Web頁面DataNodes 顯示問題 當安裝成功後,各個節點JPS均正常,在HDFS的Web頁面的Overview頁面顯示Live Nodes的個數爲3,但是在具體細節的Datanodes頁面只

原创 First-Head 設計模式:狀態模式

狀態模式 定義 狀態模式允許對象在內部狀態改變時改變它的行爲,對象看起來好像修改了它的類。 需求 糖果機有多個狀態,不同狀態都有相應的辦法,所以需要很多if條件,如果增加一個狀態的話就需要改變所有的代碼。 傳統設計 對每個方法寫四個if(

原创 Frist Head-設計模式:模板方法模式

模板方法模式 定義 模板方法模式在一個方法中定義一個算法的骨架,而將一些步驟延遲到子類之中。模板方法使得子類可以在不改變算法結構的情況下,重新定義算法中的某些步驟。 需求 實現煮咖啡和煮茶,兩者之間的步驟及其相似。 傳統設計 將一樣的步驟

原创 Word2Vector

Word2vec 詞向量的概念 將 word映射到一個新的空間中,並以多維的連續實數向量進行表示叫做“Word Represention” 或 “Word Embedding”。自從21世紀以來,人們逐漸從原始的詞向量稀疏表示法過渡到現在

原创 數據結構與算法分析:圖論

圖論算法 定義 路徑:由一個頂點序列使得這樣一條路徑。 環:路徑,路徑長爲0,爲環。 簡單路徑:不包含環,所有頂點是互異的,但是第一個和最後一個可以是相同的。 圈:滿足的路徑稱爲圈,若各該路徑是簡單路徑,則爲簡單圈。 連通的無向圖:無向圖

原创 IntelliJ IDEA 運行Hadoop2.7.0 wordcount 實例

IntelliJ IDEA 運行Hadoop2.7.0 wordcount 實例 背景        Hadoop2.7.0在虛擬機上安裝完成,core-site.xml中配置的fs.defaultFS 端口爲9000。 1 新建mave

原创 Head First-設計模式:工廠模式

工廠方法模式 定義 工廠方法模式定義了一個創建對象的接口,但由子類決定要實例化的類是哪一個,工廠方法讓類把實例化推遲到子類。 該方法通過子類繼承來創建對象。 需求 披薩店有很多家分店,每個分店需要製作不同的風味的披薩,但是他們的製作過程是

原创 First Head-設計模式:適配器模式和外觀模式

適配器模式 定義 適配器模式將一個類的接口,轉換成客戶期望的另一個接口。適配器讓原本不兼容的類可以無間合作。 需求 客戶需要一隻鴨子,但是沒有鴨子,所以需要用火雞來冒充。 傳統設計 因爲火雞和鴨子是不同的類,所有無法適配。 Decorat

原创 First-Head:迭代器模式和組合模式

迭代器模式 定義 迭代器模式提供一種方法順序訪問一個聚合對象中的各個元素,而又不暴露其內部的表示。 需求 煎餅屋和午餐店要合併,但是煎餅屋採用arraylist實現,午餐店採用數組實現,現在服務員要告訴顧客有哪些食品。 傳統設計 兩個fo