台部落hjh00

在官方API文檔可以查到用法。 def trainClassifier(input: RDD[LabeledPoint], numClasses: Int, categoricalFeaturesInfo: Map[Int, Int],

2020-06-30 01:53:27

NumPy 提供一個N維數組對象類ndarray。它是SciPy和Scikit-learn等的數據結構，它支持快速線性代數計算。創建數組從list到一維數組 import numpy as np list_of_ints = [1,

2020-06-30 01:53:27

Jenkins 筆記Jenkins 入門 - 01- 安裝部署基礎環境安裝jenkins Jenkins 入門 - 01- 安裝部署基礎環境操作系統，Cent OS 7.x 用戶組和用戶 devops/devops [

2020-06-30 01:53:26

Go語言入坑記錄原因目標語言特性相關Excel文件讀寫文件操作json文件讀寫xml文件讀寫日誌文件讀寫http client命令行參數小結原因本來主要使用Python，但是由於運行環境受限制的原因，依賴包的維護比較麻煩。因此

2020-06-30 01:53:26

在官方的API文檔可以查到用法。 def train(input: RDD[LabeledPoint], lambda: Double, modelType: String): NaiveBayesModel input RDD of (

2020-06-30 01:53:26

1. git 查看查看遠程倉庫分支 (demo) oliver@oliver:~/_demo/demo-app$ git remote -v origin https://github.com/targetoyes/book-demo.

2020-06-30 01:53:26

配置好hive後，spark sql 配置就很簡單了，實際上只要配置一個hive-site.xml文件，拷貝到spark/conf目錄下。這個文件是給spark使用的，hive的配置文件用自己的配置文件。 1. 配置hive-site.x

2020-02-21 13:28:17

1. KNN算法 K最近鄰(k-Nearest Neighbor，KNN)分類算法的核心思想是如果一個樣本在特徵空間中的k個最相似(即特徵空間中最鄰近)的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別。KNN算法可用於多分類，KNN

2020-02-21 13:28:17

1. 軟件列表 apache-hive-1.1.1-bin.tar.gz mysql-5.6.16.tar.gz mysql-connector-java-5.6-bin.jar sasl-0.2.1.tar.gz thrift-0.10

2020-02-21 13:28:17

1. 軟件列表 hadoop 2.6.0 、 zookeeper 3.4.6和hbase 1.2.0 2. 機器環境序號主機名 IP 安裝軟件 1 d-hdp-client 192.1.131.199 hadoop hbase

2020-02-21 13:28:17

記錄matplotlib的基本操作學習筆記，需要時可以直接拷貝。 1. 繪製曲線用numpy的linspace() 函數獲取一組數據x，用numpy的cos和sin函數獲得y值，然後用matplotlib.pyplot畫圖。可以使用rc

2020-02-21 13:28:17

Spark Streaming 是一個基於spark的實時計算框架。詳細說明參考Spark Streaming Programming Guide. 以下是編程指南WordCount例子的在spark-shell了實驗記錄。運行前，把sp

2020-02-21 13:28:16

1. 軟件列表 hadoop 2.6.0、 zookeeper 3.4.6和habase 1.2.0已安裝好，參見《HBase 安裝配置》。在此基礎上安裝scala-2.10.6和spark-1.6.0-bin-hadoop2.6。 2

2020-02-21 13:28:16

RDD（Resilient Distributed Datasets）分佈式彈性數據集，將數據分佈存儲在不同節點的計算機內存中進行存儲和處理。RDD的任務被分成兩部分：Transformation和Action。Transformatio

2020-02-21 13:28:05

1. spark 集羣環境 spark的安裝配置參考《Spark 安裝》。本環境是用了6臺工作站，規劃如下：序號主機名 IP 用途 1 bdml-c01 192.168.200.170 客戶端 2 bdml-m01 192.168

2020-02-21 13:28:05