原创 leetcode排列組合集合

46. Permutations Given a collection of distinct integers, return all possible permutations. Example: Input: [1,2,3]

原创 邏輯迴歸與最大似然估計推導

目錄 邏輯迴歸(對數機率迴歸) 1.廣義線性模型 2.邏輯迴歸的假設 3. 邏輯迴歸的代價函數 爲什麼LR中使用交叉熵損失函數而不使用MSE損失函數? 3. 極大似然估計 4. 利用梯度下降法求解參數w 4.1 三種梯度下降方法的選擇 5

原创 決策樹完整總結(ID3,C4.5,CART)

文章目錄1.介紹1.1 定義1.2 決策樹與條件概率分佈1.3 決策樹的構建1.3.1 劃分準則1.3.2 劃分方式1.3.3 停止條件2. 決策樹的構建過程2.1 ID3算法2.2 C4.5算法2.3 CART(分類和迴歸樹)3

原创 樸素貝葉斯分類器及python實現

1.貝葉斯分類的基礎–貝葉斯定理 貝葉斯法則:假設數據遵循某種概率分佈,通過對概率的分析推理以做出最優的決策 貝葉斯公式:根據先驗概率和似然來計算後驗概率 P(c∣X)=P(X∣c)P(c)P(X)P(c|X) = \fr

原创 決策樹(ID3,C4.5,CART算法具體過程)

  1.介紹 1.1 定義 決策樹模型是一種描述對實例進行分類的樹形結構,決策樹由結點和有向邊組成。其中結點有兩種類型:內部結點和葉節點。內部結點表示一個特徵或屬性,葉節點表示一個類。 在分類問題中,就表示基於特徵對實例進行分類的過程。

原创 交叉熵與KL散度和交叉熵之間的關係

1.熵 熵的本質是香農信息量log1plog\frac{1}{p}logp1​ 現有關於樣本的兩個概率分佈ppp和qqq,其中ppp爲真實分佈,qqq爲非真實分佈。按照真實分佈ppp來衡量識別一個樣本所需要的編碼長度的期望(即平均

原创 最小生成樹與並查集(leetcode684,685, 721)

文章目錄最小生成樹Kruskal算法Prime算法並查集三個操作具體題目leetcode 684path compression和union by rankleecode 685leetcode 721參考資料 最小生成樹 說道並

原创 用快排解決Leetcode 169. Majority Element(c++實現)

快速排序 快速排序的基本思想:通過一趟排序將待排記錄分隔成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可分別對這兩部分記錄繼續進行排序,以達到整個序列有序。 算法描述 快速排序使用分治法來把一個串(list)分爲

原创 2019字節跳動筆試題

第三題: 有n個人參加編程比賽,比賽結束後每個人都得到一個分數,現在所有人排成一圈(第一個和第n個相鄰)領取獎品,要求: 1.現在某個人的分數比左右的人告,那麼獎品數量也比左右的人多; 2.每個人至少得到一個獎品 問最少應該準備多

原创 ROC及AUC計算方法及原理

1.非均衡分類問題 在大多數情況下不同類別的分類代價並不相等,即將樣本分類爲正例或反例的代價是不能相提並論的。例如在垃圾郵件過濾中,我們希望重要的郵件永遠不要被誤判爲垃圾郵件,還有在癌症檢測中,寧願誤判也不漏判。在這種情況下,僅僅使用分類

原创 Boosting算法與假設間隔

Boosting算法與假設間隔間隔概念AdaBoost算法AdaBoost 平均間隔參考資料 間隔概念 間隔是一種幾何度量,能夠用於度量分類器預測的可信程度。間隔的兩種定義:①樣本間隔: 被預測樣本與決策面間的距離。支持向量機(

原创 FM算法

FM算法存在的問題基於的思想具體方法時間複雜度優點參考資料 存在的問題 稀疏數據下的特徵組合問題 類別特徵經過one-hot編碼轉換後會導致樣本特徵的稀疏性,並且會得到千萬級別甚至上億級別的特徵空間,導致特徵空間爆炸 多項式模

原创 DFS深度優先搜索(leetcode題目)

題目鏈接 leetcode 494. Target Sum dp(暴力搜索) class Solution { public: int ways; int findTargetSumWays(vector<in

原创 Adapting Markov Decision Process for Search Result Diversification

多樣化排名的MDP形式 多樣化排序模型可以被看作是在每一個排序位置學習MDP模型的參數。其中MDP的states,actions,rewards,transitions和policy。 State S: st=[Zt,Xt,ht]

原创 Diverse Ranking with Policy-Value Networks

文章目錄Abstract:Introduction相關工作2.1搜索結果多樣性2.2 強化學習for IR3. MDP and MCTS3.1 Markov decision process3.2 Monte Carlo tree