原创 設計模式總結 之 創建型

設計模式總結 之 創建型參考:http://blog.csdn.net/jason0539設計模式和原則 強烈推薦 http://blog.csdn.net/zhengzhb/article/category/926691總共有24中設計

原创 1.begin

開始 2016年1月份拿到碩士畢業證,然後開始了工作. 當年Alphgo 打敗了李世石,讓注入大數據血液的AI再次成爲人們熱議的話題,新的風口.當時不覺明歷便投身到大數據的熱潮中. 熟悉了hadoop .hive  .hbase .st

原创 Deeplearning 博客和論文資源

國內資源 一 .博客         1. zouxy09: Deep Learning(深度學習)學習筆記整理系列   http://blog.csdn.net/zouxy09/article/details/8775360/   

原创 Idea 快捷鍵

Alt+回車 導入包,自動修正 Ctrl+N   查找類 Ctrl+Shift+N 查找文件 Ctrl+Alt+L  格式化代碼 Ctrl+Alt+O 優化導入的類和包 Alt+Insert 生成代碼(如get,set方法,構造函數等)

原创 深度學習Deeplearning4j 入門實戰(5):基於多層感知機的Mnist壓縮以及在Spark實現

在上一篇博客中,我們用基於RBM的的Deep AutoEncoder對Mnist數據集進行壓縮,應該說取得了不錯的效果。這裏,我們將神經網絡這塊替換成傳統的全連接的前饋神經網絡對Mnist數據集進行壓縮,看看兩者的效果有什麼異同。整個代碼

原创 Spark上PageRank的簡單應用

 在《Spark快速大數據分析》裏有一段不明覺厲的Scala代碼,只用了區區幾行即實現了Google的PageRank算法,於是照貓畫虎做了個小實驗驗證了一下。一、實驗環境spark 1.5.0二、PageRank算法簡介(摘自《Spar

原创 深度學習Deeplearning4j 入門實戰(3):簡介Nd4j中JavaCPP技術的應用

Deeplearning4j中張量的計算是由一個叫Nd4j的庫來完成的。它類似於Python中的numpy,對高維向量的計算有比較好的支持。並且,爲了提高運算的性能,很多計算任務是通過調用C++來完成的。具體來說,底層C++運行張量計算可

原创 graphx中Pregel函數詳解

1、PregelAPI 圖本質上是一種遞歸的數據結構,其頂點的屬性值依賴於其鄰接頂點,而其鄰接頂點屬性又依賴於其鄰接頂點,許多重要的圖算法通過迭代計算每個頂點的屬性直到到達定點條件,這些迭代的圖算法被抽象成一系列圖並行操作。  

原创 python 2.7安裝xgboost

I think it works for normal python, too. If you use python 3.5: 1: download the package here, the version depends o

原创 深度學習Deeplearning4j入門 實戰(1):Deeplearning4j 手寫體數字識別

   轉載:http://blog.csdn.net/wangongxi/article/details/54576594 最近這幾年,深度學習很火,包括自己在內的很多對機器學習還是一知半解的小白也開始用深度學習做些應用。由於小白的等級不

原创 深度學習Deeplearning4j 入門實戰(4):Deep AutoEncoder進行Mnist壓縮的Spark實現

圖像壓縮,在圖像的檢索、圖像傳輸等領域都有着廣泛的應用。事實上,圖像的壓縮,我覺得也可以算是一種圖像特徵的提取方法。如果從這個角度來看的話,那麼在理論上利用這些壓縮後的數據去做圖像的分類,圖像的檢索也是可以的。圖像壓縮的算法有很多種,這

原创 深度學習Deeplearning4j 入門實戰(6):基於LSTM的文本情感識別及其Spark實現

在做機器學習的各種應用中,文本分類是比較典型的一種。比如,微博的分類,電商中商品評價的好壞分類,新聞的分類等等。同時,文本作爲一種重要的特徵,也在CTR預估,推薦等應用中起着作用。就文本分類這個應用而言,通常的做法是基於詞袋模型和詞向量模

原创 Java集合總結

本文首先針對 Java 集合接口進行了一些介紹,並對這些接口的實現類進行詳細描述,包括 LinkedList、ArrayList、Vector、Stack、Hashtable、HashMap、WeakHashMap 等,然後對一些實現類

原创 Java Log4j 簡單介紹

Java Log4j                             簡介:       Log4j是Apache的一個開放源代碼項目,通過使用Log4j,我們可以控制日誌信息輸送的目的地是控制檯、文件、GUI組件、甚至是

原创 機器學習H2O AI框架簡介

機器學習H2O AI框架簡介 1.  H2O框架 優勢:自己實現分佈式計算框架,算法種類全,有深度學習算法,同時可以通過Sparkling-water將 h2o 和spark 進行完美整合   a.底層數據層 底層數據讀取Hdfs數據