原创 【降維方法】- 主成分分析(PCA)

推薦一篇絕對好的文章:理解PCA的數學原理 首先PCA設計嚴格的數學推導證明!尤其設計矩陣的知識比較多,這裏會簡要地記錄自己學習過程中覺得很重要的東西,具體的細節可以看我上面推薦的一篇文章。 簡介 PCA(Principle C

原创 Codechef April Challenge 2017

Similar Dishes & Dish Of Life & Bear and Row 01 這三個題比較簡單吧,一眼題。。。 Bear and Clique Distances 題意:給定 N 個節點的圖,其中編號1−

原创 CDOJ 1351(樹形DP)

題意&思路: 題意:帶權邊樹上,在起點0出發,初始值爲V ,求最多能訪問的節點數目? 如果數據小一點,我們可以考慮 dp[u][i] ,表示u節點及其子樹花費i最多能夠訪問的節點數,這個是很好做的,樹上揹包嘛。 但是題目多詢問,

原创 【論文筆記】TensorFlow深度神經網絡提前穩定特徵重要性

論文地址:Early Stabilizing Feature Importance for TensorFlow Deep Neural Networks 博客裏只給出一下論文中介紹的方法這一章節,論文中前面介紹了神經網絡中特徵

原创 【論文筆記】CUSBoost:基於聚類的提升下采樣的非平衡數據分類

原論文地址:CUSBoost: Cluster-based Under-sampling with Boosting for Imbalanced Classification Abstract 普通的機器學習方法,對於非平衡數據

原创 【論文筆記】Deep Survival: A Deep Cox Proportional Hazards Network

相關資源 原論文地址:here 論文中使用的深度生存分析庫:DeepSurv,是基於Theano 和 Lasagne庫實現的,支持訓練網絡模型,預測等功能。 考慮到DeepSurv庫中存在着一些錯誤以及未實現的功能,博主使用目前主

原创 KNN & NaiveBayes 分類算法

KNN 介紹: KNN算法屬於分類算法裏比較簡單而且思路明瞭的一種算法,所以這裏就簡單介紹一下它的主要思想及實現步驟: KNN算法全名爲k-Nearest Neighbor,就是K最近鄰的意思。KNN也是一種分類算法。但是與之前

原创 Deep Learning - 第二章:線性代數

逆矩陣 可逆矩陣 A−1 的定義爲滿足下列式子: A−1⋅A=I 注意是左乘矩陣,這樣做的原因在解線性方程組的時候就能體現出來; 線性方程組的形式如下: A⋅x=b A−1⋅A⋅x=A−1⋅b x=A−1⋅

原创 決策樹分類算法:ID3 & C4.5 & CART

分類的概念 分類的基本任務就是根據給定的一系列屬性集,最後去判別它屬於的類型! 比如我們現在需要去給動物分類,類別可選項爲哺乳類,爬行類,鳥類,魚類,或者兩棲類。給你一些屬性集如這個動物的體溫,是否胎生,是否爲水生動物,是否爲飛

原创 CDOJ 1136(數位DP)

題意&思路: 題意:求區間[1,n] 內滿足i < j, 並且f(i) > f(j) 的數對數目? 學習了一波數位dp的一般寫法,很爽。。。。 首先把原數字轉化爲二進制數,然後考慮dp[pos][diff][f1][f2][f3

原创 More supervise learning Alg

之前提到過三種簡單基礎的監督學習算法,但是選擇還有更多種: KNN(思路易於理解,熟悉其結合KD-tree來其優化算法的時間性能) ADAboost Random Forests 請嘗試使用scikit-learn來得到各類算

原创 CDOJ 1346(斜率DP)

題意&思路: 題意:把大的區間分段,每一段的有一個花費,求總的最小花費。 這種分段的花費的題,貌似成了斜率dp的一眼題了,上次CF的E題比賽的時候,實力套路一波斜率dp的推導過程,感覺還不錯,還學習了下二維的斜率優化。 首先,你

原创 BSG挑戰賽

A/C 模擬題,較簡單 B-AVL樹的種類 平衡二叉樹(AVL樹),是指左右子樹高度差至多爲1的二叉樹,並且該樹的左右兩個子樹也均爲AVL樹。 現在問題來了,給定AVL樹的節點個數n,求有多少種形態的AVL樹恰好有n個節點。

原创 SVM支持向量機

SVM 支持向量機,用於向量空間的分類,屬於數據挖掘中的分類算法。其過程就是接受訓練數據(即有明確類標號的數據),構造其特徵向量,對應在多維空間上的點,使用SVM算法找出一個最大邊緣超平面,使得它的左右兩側分爲兩種不同的類別。這

原创 K-Means聚類算法

記錄一下KMeans算法裏一些主要的東西 簡介 K-Means是一種用來進行聚類分析的算法,用以得到每個數據所屬的cluster。在給定的數據沒有標籤的情況下,由這種聚類分析算法得到每條數據的cluster,屬於非監督式學習算法