原创 -bash: cd: .ssh: No such file or directory

在免密登錄過程中,若遇到如題錯誤,目錄中若錯在如下文件: 則將這三個文件刪除,然後按照https://www.linuxidc.com/Linux/2018-09/154112.htm文章來進行配置,注意,在該篇文章中,ssh-copy

原创 第3章 Spark的設計與運行原理

Table of Contents Spark概述 Spark簡介 Scala簡介 Spark與Hadoop的比較 Spark生態系統 Spark運行架構 基本概念 Spark運行基本流程 RDD的設計與運行原理 1.RDD設計背景 2.

原创 java.lang.IllegalArgumentException: Wrong FS: hdfs://, expected: file:

參考:https://stackoverflow.com/questions/32078441/wrong-fs-expected-file-when-trying-to-read-file-from-hdfs-in-java 解決辦法

原创 查看HIVE所在HDFS中的位置

在 hive 環境下可通過show create table的命令: hive> show databases; # 查看所有的數據庫 OK app dev hive> use dev; # 選擇dev數據庫 OK hive> show

原创 (Leetcode 142)Linked List Cycle (II) (快慢指針詳解)

Leetcode141題和142題很相似,都涉及到了快慢指針的算法。快慢指針就是設置兩個指針,一個快指針,一個慢指針來達到解題的目的。下面分爲以下幾個模塊來講解: 解第141題 解第142題 爲什麼快指針一定要設置爲慢指針的2倍 快慢指針

原创 `set_session` is not available when using TensorFlow 2.0.

若是遇到如題錯誤,則將 keras.backend.tensorflow_backend.set_session(tf.compat.v1.Session(config=config)) 改爲 tf.compat.v1.keras.bac

原创 關於遞歸的理解

代碼如下: // 遞歸練習 public class recursionTest { public static int getMax(int[] arr,int l,int r){ if(l == r

原创 Field NIMBUS_SEEDS must be an Iterable but was a class java.lang.String

通過storm nimbus啓動單機storm時,報瞭如題錯誤。 解決辦法的參考文章:https://www.mail-archive.com/[email protected]/msg44929.html

原创 jena_climate_2009_2016耶拿天氣數據集--百度雲

感謝github上分享。 鏈接:https://pan.baidu.com/s/1eP2Q79r3YADzPOCjIOBKbw  提取碼:pgqh  不需解壓密碼

原创 設計一個隊列 O(1) 均攤分析

public class Queue { @Test public void demo01(){ MyDeque myDeque = new MyDeque(10); myDequ

原创 Titanic data deal

原文鏈接:https://www.kaggle.com/sinakhorami/titanic-best-working-classifier/data %matplotlib inli

原创 多重共線性的個人理解

多重共線性(multicolinearity)是指線性迴歸模型鐘的自變量之間由於存在高度相關係數而使模型的權重參數估計失真或者難以估計準確性的一種特性,多重是指一個自變量可能與多個其他自變量之間存在相關關係。 多重共線性會放大隨機

原创 混淆矩陣和ROC的個人理解

以下都是個人得到的認識,不一定正確! 混淆矩陣 肯定類別 否定類別 陽性判斷 真陽性(TP) 假陽性(FP) 陰性判斷 假陰性(FN) 真陰性(TN) 這是我自己對上面混淆矩陣的理解: 真陽性: 真:表

原创 非均衡樣本的簡單認識

非均衡樣本的定義 在分類問題中,每種類別的出現概率未必均衡。 比如 : 信用風險:正常用戶遠多於逾期/違約用戶。 非平衡樣本導致的問題: 降低少類樣本的靈敏性。 非均衡樣本的解決辦法: 1 過採樣 考慮對小類下的樣本(不足1爲甚

原创 sklearn.model_selection.train_test_split方法初識

sklearn.model_selection.train_test_split 將數組或矩陣切分成隨機訓練和測試子集。 參數列表: 1 *arrays : sequence of indexables with same l