原创 機器學習--隨機森林

模型思想 隨機森林是集成學習的一種,集成多個弱學習器形成一個強學習器。弱學習器要求是好而不同,具有一定的準確性和多樣性,多個學習器集成產生更好的效果。 對於迴歸問題:簡單平均法。 對於分類問題:簡單投票法。 Bagging 爲

原创 機器學習--SVM支持向量機

SVM思想 SVM用於解決二分類的問題(也可以擴展到解決多分類問題和迴歸問題),它的思想是在特徵的向量空間中找到一個分界超平面,使得離超平面最近的點儘可能的大,這些距離超平面最近的點也稱爲支持向量。 SVM算法過程 點到平面的距離

原创 tensorflow--基礎知識

目錄 1 基本概念 2 批標準化BN 3 優化方法 1 基本概念 圖(Graph):圖描述了計算的過程,TensorFlow使用圖來表示計 算任務。 張量(Tensor):TensorFlow使用tensor表示數據。每個T

原创 SpringBoot 之 IOC

1、IoC的作用 IoC(控制反轉),主要的作用就是降低代碼之間的耦合程度。 2、Bean的裝配 使用Spring boot生成對象需要幾個步驟: 1、爲需要生成對象的類打上@Component的註解標記,這些類會被放到IoC容器

原创 機器學習--迴歸算法

算法 線性迴歸(連續) 目標函數推導 預測值與誤差: y(i)=θTx(i)+εi 由中心極限定理可知,誤差服從正態分佈: p(εi)=12π√σexp(−(εi)22σ2) 帶入可得: p(εi)=12π√σexp(−

原创 Docker基礎--天池Docker入門

Docker基礎 1、Docer基礎概念 鏡像(Images):就是靜態的文件系統,裏面有源代碼、依賴的庫、配置文件等,類似於github下載的代碼包,但是是一個完整的系統,可以直接運行。可以用docker images查看系統

原创 Spark 實現常用的map reduce功能 (Java版本)

記錄利用spark core的函數,完成一些map reduce功能的練習,spark core有Transformation和Action兩種算子,Transformation完成中間轉變過程,不會把運算真的算出來,Action

原创 歸併排序練習題(Java)

1、算法原理: 首先歸併排序的基本是將兩個數組合並,將兩個有序的數組合併爲一個有序的數組,需要一個額外的輔助數組,例如a、b數組,合併爲c c[0] 是 a[0] 和 b[0] 中較小的數,假設是a[0],然後a數組的指針加1

原创 揹包問題及其變體(Java)

揹包問題: 最經典的0-1揹包 揹包問題是有一個一定容量的揹包,然後有一堆物品,這些物品有一定的重量,要求在不超過揹包容量的情況下,裝最多的重量的問題。 揹包問題的變體 揹包問題有很多的變體,主要有以下幾個: 物品不僅僅有重量還

原创 Java多線程

1、多進程與多線程 多進程是指多個進程在單個處理器上併發執行,CPU在某個時間點,只能執行一個程序,CPU計算較快,多個進程輪換使用CPU使用戶感覺好像多個進程同步執行。 而多線程則是擴展了多進程的概念,同一個進程可以併發處理多個

原创 快速排序練習題(Java)

快速排序 1、算法實現 快速排序的核心方法:partition,它首先隨機選擇一個數,然後以這個數爲軸,小於它的放在它前面,大於它的放在後面,然後放回這個軸數的排序位置。有很多種實現方法,選擇我比較熟悉的一種: private i

原创 《代碼整潔之道》部分筆記

1、命名 名副其實:讓讀者看名字就明白它的作用 避免誤導:不要用有歧義的詞語,例如不是List就不要帶有List 有意義的區分:不要加一些廢話,例如NameString,例如ProductData和ProductInfo,不能區

原创 Java的異常處理

1、關鍵字 Java異常處理中有5個關鍵字: try:try{可能發生異常的代碼} catch:catch(異常類型 e){處理異常e的代碼塊} finally:finally{回收資源代碼塊},由於try中代碼可能出現異常,c

原创 Java三大特性:封裝、繼承、多態

每個特性圍繞含義、目的、知識點記錄: 封裝 1、含義: 將對象的狀態信息隱藏在內部,不允許外部程序直接訪問,通過該對象的類所提供的方法進行訪問。 2、目的: 1、限制不合理的訪問 2、保證對象信息的完成性,便於修改,提高可維護性

原创 機器學習--集成學習GBDT

1. GBDT思想 GBDT也是集成學習Boosting的其中一種,Boosting是由多個弱學習器組成,與bagging不同,Boosting學習器之間有關聯的關係。AdaBoost是通過前面的學習器模型來決定當前的學習器模型的每個樣本