台部落lingerlanlan

一天一段scala代碼（十五）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples object Ex

2020-06-13 23:02:03

一天一段scala代碼（九）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples import scala

2020-06-13 23:02:03

一天一段scala代碼（八）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples class Per

2020-06-13 23:02:03

map-reduce入門最近在改寫mahout源碼，感覺自己map-reduce功力不夠深厚，因此打算系統學習一下。 map-reduce其實是一種編程範式，從統計詞頻（wordCount）程序來講解map-reduce的

2020-06-13 23:02:03

在處理圖像數據時，有這麼一種需求：圖像通常是一個矩陣數據，需要將矩陣數據通過base64編碼傳輸，傳輸完畢之後解碼還原得到原來的矩陣數據。 import numpy as np import base64 matrix_data

2020-06-13 23:02:03

遠程終端docker容器linux操作系統安裝MATLAB 安裝參考流程： linux終端(服務器)安裝matlab2016b https://blog.csdn.net/u014535579/article/details/

2020-06-13 23:02:03

一天一段scala代碼（十二）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples object Exam

2020-02-26 07:02:49

一天一段scala代碼（十一）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples class Fr

2020-02-26 07:02:49

給大數據文件的每一行產生唯一的id 4個主要思路： 1 單線程處理 2 普通多線程 3 hive 4 Hadoop 搜到一些參考資料《Hadoop實戰》的筆記-2、Hadoop輸入與輸出 https://book.douban

2020-02-26 07:02:49

相似度計算map-reduce實現思路輸入： 1 f(1) 2 f(2) 3 f(3) 4 f(4) mapper: 1,2 f(1) 1,3 f(1) 1,4 f(1) 1,2 f(2) 2,3 f(2) 2,4 f(

2020-02-26 07:02:49

一天一段scala代碼（十三）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples object Exa

2020-02-26 07:02:49

一天一段scala代碼（十六）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples object Exam

2020-02-26 07:02:49

xgboost快速入門 xgboost是gbdt算法的實現，可以做迴歸，分類，和排序。支持各種語言調用，支持單機和分佈式。非常適合於大規模數據集。項目主頁 https://github.com/dmlc/xgboost 安

2020-02-26 07:02:49

一天一段scala代碼（十四）爲了更好的駕馭spark，最近在學習scala語言特性，主要看《快學scala》，順便把一些自己認爲有用的代碼記下來。 package examples object Exa

2020-02-26 07:02:49

liblinear簡單使用說明 liblinear適合解決大規模數據和高維稀疏特徵的分類和迴歸問題。特徵文件格式：跟libsvm的一致，每一行都是 label index1:value1 index2:value2 的稀疏向量

2020-02-26 07:02:49