原创 EM算法(Expectation Maximization Algorithm )

EM算法      在學Ng機器學習課程的時候一直覺得EM算法很難理解,看了這篇博客方纔豁然開朗!      下面主要介紹EM的整個推導過程。 1. Jensen不等式       回顧優化理論中的一些概念。設f是定義域爲實數的

原创 貪喫蛇大作戰中的“馬太效應”

貪喫蛇大作戰中的“馬太效應”     貪喫蛇大作戰是這段時間很火的一款手機遊戲,這個遊戲的樂趣在於簡單粗暴,對的,當下爲工作生活而忙忙碌碌的我們是很難爲一個手機遊戲而犧牲太多的腦細胞的。在這個遊戲中,我們只需要一點點小的反應能力外加一些小

原创 路徑規劃方法之-隨機路徑圖法(PRM)

隨機路徑圖法(PRM) 1. 介紹     隨機路徑圖法由Lydia E. 等人在1996年提出,它的優點在於:     1)克服了以往一些路徑規劃方法易於陷入局部極小的缺點     2)可應用於多自由度的機器人的路徑規劃中     3)

原创 歸納決策樹ID3

歸納決策樹 舉例 先上問題吧,我們統計了14天的氣象數據(指標包括outlook,temperature,humidity,windy),並已知這些天氣是否打球(play)。如果給出新一天的氣象指標數據:sunny,cool,high

原创 AI發展歷史

時間 人物 事件 意義 1633 Rene Descartes 發表著作《論人》 提出靈魂存在於大腦的松果體中 1714 Gottfried Wilhelm Leibniz 《單子論》 一切

原创 人臉識別必讀的N篇文章

人臉識別必讀的N篇文章 一.人臉檢測/跟蹤   人臉檢測/跟蹤的目的是在圖像/視頻中找到各個人臉所在的位置和大小;對於跟蹤而言,還需要確定幀間不同人臉間的對應關係。   1.Robust Real-time Object Det

原创 非均衡分類問題(準確率,召回率,F measure)

最近一直在做相關推薦方面的研究與應用工作,召回率與準確率這兩個概念偶爾會遇到, 知道意思,但是有時候要很清晰地向同學介紹則有點轉不過彎來。 召回率和準確率是數據挖掘中預測、互聯網中的搜索引擎等經常涉及的兩個概念和指標。 召回率:Rec

原创 機器學習中的相似性度量

機器學習中的相似性度量   在做分類時常常需要估算不同樣本之間的相似性度量(Similarity Measurement),這時通常採用的方法就是計算樣本間的“距離”(Distance)。採用什麼樣的方法計算距離是很講究,甚至關

原创 FP-growth算法高效發現頻繁項集(Python代碼)

FP-growth算法高效發現頻繁項集 1. 介紹     我們都有過這樣的經歷,在百度搜索裏輸入一個單詞或者單詞一部分的時候,搜索引擎會自動補全查詢詞項,比如當我輸入“人工”兩字的時候,度娘第一個反應是:咦,這人是不是想找人工受精相關的

原创 三種參數估計方法(MLE,MAP,貝葉斯估計)

以PLSA和LDA爲代表的文本語言模型是當今統計自然語言處理研究的熱點問題。這類語言模型一般都是對文本的生成過程提出自己的概率圖模型,然後利用觀察到的語料數據對模型參數做估計。有了語言模型和相應的模型參數,我們可以有很多重要的應用,比

原创 數據挖掘中的關聯規則挖掘

數據挖掘中的關聯規則挖掘   數據挖掘是指以某種方式分析數據源,從中發現一些潛在的有用的信息,所以數據挖掘又稱作知識發現,而關聯規則挖掘則是數據挖掘中的一個很重要的課題,顧名思義,它是從數據背後發現事物之間可能存在的關聯或者聯繫。

原创 XGBoost解決多分類問題

XGBoost解決多分類問題 寫在前面的話     XGBoost官方給的二分類問題的例子是區別蘑菇有無毒,數據集和代碼都可以在xgboost中的demo文件夾對應找到,我是用的Anaconda安裝的XGBoost,實現起來比較容易。唯一

原创 貪吃蛇大作戰中的“馬太效應”

貪吃蛇大作戰中的“馬太效應”     貪吃蛇大作戰是這段時間很火的一款手機遊戲,這個遊戲的樂趣在於簡單粗暴,對的,當下爲工作生活而忙忙碌碌的我們是很難爲一個手機遊戲而犧牲太多的腦細胞的。在這個遊戲中,我們只需要一點點小的反應能力外加一些小

原创 2030年的人工智能與生活(AI and Life in 2030)

作者:Anqi 鏈接:https://zhuanlan.zhihu.com/p/22308870 來源:知乎 著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。第一部分:什麼是人工智能? 本節介紹了研究人員和從業者如何定

原创 決策樹C4.5

決策樹C4.5 C4.5決策樹在ID3決策樹的基礎之上稍作改進,請先閱讀ID3決策樹。 C4.5克服了ID3的2個缺點: 1.用信息增益選擇屬性時偏向於選擇分枝比較多的屬性值,即取值多的屬性 2.不能處理連貫屬性 Outloo