原创 【ML小結2】信息論

信息量:不確定性大小 信息量等於不確定性的大小。 自信息:一件不太可能的事發生,要比一件非常可能的事發生,提供更多的信息I(x)=−logP(x)I(x)=-logP(x)I(x)=−logP(x) 信息熵:量化整個概率分佈中的

原创 【ML小結10】集成學習

1. 集成學習的思想 對於訓練集數據,我們通過訓練若干個個體學習器,通過一定的結合策略,就可以最終形成一個強學習器,以達到博採衆長的目的。 集成學習(Ensemble learning)可以用於分類問題集成,迴歸問題集成,特徵選取

原创 實現鏈表翻轉的兩種方法

題目 從尾到頭打印鏈表_牛客網 https://www.nowcoder.com/practice/d0267f7f55b3412ba93bd35cfa8e8035?tpId=13&tqId=11156&tPage=1&rp=1

原创 【ML小結6】關聯分析與序列模式關聯分析

一、關聯分析 關聯分析主要是用於從數據集中發現數據項之間的關係。 1. 基本概念 1.1 支持度 X → Y 的支持度表示項集 {X,Y} 在總項集中出現的概率: support(X→Y)=P(X,Y)support(X\righ

原创 【ML小結11】高斯混合模型GMM

1. 模型表示 高斯混合模型是指具有如下形式的概率分佈模型:P(y∣θ)=∑k=1Kαkϕ(y∣θk)P(y|\theta)=\sum_{k=1}^K\alpha_k\phi(y|\theta_k)P(y∣θ)=k=1∑K​αk​

原创 Scala入門(2)

1 函數式編程思想 純函數,沒有副作用 即沒有諸如修改全局變量、拋出異常、IO讀寫和調用有副作用的函數等狀態變化 參數和函數體都是引用透明 即對於相同的輸入,總是得到相同的輸出。反例:append函數。 爲了獲得引用透明性,任何

原创 IDEA連接Spark集羣執行Scala程序

前言 接下來下定決心好好學習Spark了。。。ps:關於Spark安裝和使用以及Spark分佈式集羣環境搭建,請見參考內容1-4,這裏就不作闡述了。 步驟 首先安裝Scala插件,File->Settings->Plugins