原创 推薦系統學習祕籍
本篇博客主要內容是對推薦系統進行詳細的概述及講解,對新手來說是非常適合的。 本篇文章主要內容包括推薦系統的相關概念、推薦系統的架構和流程、常見的推薦算法、挖掘、召回、排序、評估和總結這幾部分。 推薦系統本質上是解決 用戶、信息和
原创 十大機器學習算法之EM算法講解及推導
EM算法也就是Expectation Maximization Algorithm,它是基於極大似然估計方法,如果大家還不是很熟悉極大似然估計可以看看這篇文章https://blog.csdn.net/blank_tj/artic
原创 機器學習常用的熵
熵 關於信息量、信息熵可以參考我的這篇文章https://blog.csdn.net/blank_tj/article/details/82056413 信息量: I(x)=−log2 p(x)I(x)=−log2 p(x)
原创 機器學習算法之Adaboost原理和計算過程
AdaBoost算法是基於Boosting思想的機器學習算法,AdaBoost是adaptive boosting(自適應boosting)的縮寫,其運行過程如下: 1) 計算樣本權重 {(x1,y1),(x2,y2),...,(
原创 機器學習之極大似然估計的詳細理解
極大似然估計,只是一種概率論在統計學的應用,它是參數估計的方法之一。 求最大似然估計量 θ^θ^ 的一般步驟: 寫出似然函數 對似然函數取對數,並整理 求導數 解似然方程。 最大似然估計的特點: 1) 比其他估計方法更加簡
原创 一個人,向南走了一公里,然後向東走1公里,然後向北走一公里
一個人,向南走了一公里,然後向東走1公里,然後向北走一公里,這時候他發現他回到原來的地方了,這時怎麼回事呢? 這道題是不是很簡單?不過你還真不一定能做的出來準確的答案。 好吧,不相信的話,讓你先做十分鐘。 你的答案是北極點?
原创 深度學習之膠囊網絡CapsNet
論文地址:https://arxiv.org/abs/1710.09829 github地址:https://github.com/naturomics/CapsNet-Tensorflow 膠囊網絡的理解 我的理解:膠囊網絡是CN
原创 DenseNet論文解讀理解
論文名稱:Densely Connected Convolutional Networks 論文鏈接:https://arxiv.org/pdf/1608.06993.pdf 代碼的github鏈接:https://github
原创 機器學習之過擬合的解決方法
過擬合 過擬合,是指模型在訓練集上表現的很好,但是在交叉驗證集合測試集上表現一般,也就是說模型對未知樣本的預測表現一般,泛化(generalization)能力較差。 一般防止過擬合的方法有early stopping、數據集擴增(Da
原创 機器學習之隨機森林和GBDT的區別以及Xgboost和GBDT的區別
隨機森林: 理解:多棵決策樹(CART樹)https://blog.csdn.net/blank_tj/article/details/82081002組合而成,分類問題:每棵樹投票找最高票;迴歸問題:每棵樹的值求和取平均。 特點:隨機森
原创 adaboost原理和計算過程
AdaBoost算法是基於Boosting思想的機器學習算法,AdaBoost是adaptive boosting(自適應boosting)的縮寫,其運行過程如下: 1) 計算樣本權重 {(x1,y1),(x2,y2),...,(xn,y
原创 機器學習算法之Boosting算法原理和GBDT原理推導
針對Boosting的基本介紹在我的這篇文章中詳細介紹了https://blog.csdn.net/blank_tj/article/details/82229322 簡單總結Boosting:初始對每個樣本分配相同的權重,每次經過分類,
原创 你想知道的決策樹原理及推導
本篇博客的目錄: 特徵 思想 信息增益 幾個小知識點 決策樹直觀的例子 ID3,CART,C4.5算法 決策樹的特徵 優點:計算複雜度不高,輸出結果易於理解,對中間值的缺失不敏感,可以處理不相關特徵數據 缺點:可能會產生過
原创 Logistic Regression邏輯迴歸原理及推導
邏輯迴歸算法,雖說名字有迴歸,實則是一個分類模型,而且是二分類。 Logistic本質上是一個基於條件概率的判別模型(Discriminative Model) g(z) = 11+e−z11+e−z 通過這個圖像sigma函數,
原创 極大似然估計的詳細理解
極大似然估計,只是一種概率論在統計學的應用,它是參數估計的方法之一。 求最大似然估計量 θ^θ^ 的一般步驟: 寫出似然函數 對似然函數取對數,並整理 求導數 解似然方程。 最大似然估計的特點: 1) 比其他估計方法更加簡單 2