台部落画蛇添足

public class Sort { public static void main(String[] args) { int[] arr = new int[]{8,6,15,45,12,36,25,

2020-02-21 11:34:05

在本例中，我們仍然採用上一例中的數據文件。之所以存在reduce side join，是因爲在map階段不能獲取所有需要的join字段，即：同一個key對應的字段可能位於不同map中。Reduce side join是非常低效的，因爲sh

2020-02-21 11:34:05

1.本環境採用兩臺linux環境，ip分別爲： 192.168.56.101 192.168.56.102 分別修改兩臺機器的/etc/hosts文件，增加如下內容： 192.168.56.101 master 192.168.56.10

2019-09-02 18:32:02

https://blog.csdn.net/qq_32241189/article/details/80461635https://blog.csdn.net/m0epnwstyk4/article/details/79124800

2019-08-28 19:18:32

計算步驟如下： 1.首先計算各個分類的概率； 2.然後計算預測數據的各個特徵在每個分類緯度下的概率； 3.按照分類緯度計算：分類概率*每個特徵概率； 4.選出步驟3中最大的結果即爲所求；

2019-08-23 08:26:57

1.安裝Anaconda 2.設置清華源鏡像 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda conf

2019-07-30 07:53:56

1.安裝note book pip install jupyter notebook 2.進入到ipynb文件文件所在目錄，然後cmd中輸入： jupyter notebook 3.稍後瀏覽器會自動打開ipynb文件列表

2019-07-30 07:53:56

轉載此處

2019-07-08 08:56:09

K-Means是聚類算法中的一種，其中K表示類別數，Means表示均值。顧名思義K-Means是一種通過均值對數據點進行聚類的算法。K-Means算法通過預先設定的K值及每個類別的初始質心對相似的數據點進行劃分。並通過劃分後的均值迭代優化

2019-07-02 18:55:10

記錄一下，點這裏

2019-06-10 21:17:59

分享三個實用的在線分析工具： http://www.fastthread.io/ http://gceasy.io/ http://heaphero.io/

2018-12-17 16:18:18

jvm性能分析相關： 1.收集內存信息： jmap -dump:format=b,file=dump.bin pid 2.收集線程棧信息： jstack -l pid | tee jstack.txt 3.查看進程中的線程信息： top

2018-12-17 16:17:47

在Linux操作系統層面，網絡操作即爲IO操作，總共有：阻塞式，非阻塞式，複用模型，信號驅動和異步五種IO模型。阻塞式IO操作請求發起以後，從網卡等待/讀取數據，內核/到用戶態的拷貝，整個IO過程中，用戶的線程都是處於阻塞狀態。非阻塞與阻

2018-12-17 16:17:47

一、spark服務器環境： 1.配置java環境； 2.下載spark包和對應版本的hadoop包； 3.進入spark安裝目錄，在conf目錄下spark-env.sh文件的最後加入環境變量： LD_LIBRARY_PATH=$HAD

2018-10-27 01:07:46

mvn archetype:generate -DarchetypeGroupId=org.apache.flink -DarchetypeArtifactId=flink-quickstart-java -DarchetypeVers

2018-10-27 01:07:46