原创 復旦大學nlp實驗室上手教程之文本分類

文本分類 原項目地址:https://github.com/FudanNLP/nlp-beginner 感謝教師:邱錫鵬 微博:@邱錫鵬 1 文本分類任務簡介 ​ 在有監督學習中,需要提供一組有類別標記的樣本用來學習模型以及檢驗

原创 【統計學習方法讀書筆記】(二)感知機

這裏引用一張康奈爾大學老師的課件圖片,如圖所示,感知機的目的就是找尋一條直線(藍色),可以把正樣本集(綠色)、負樣本集(紅色)分開 1、什麼是符號函數sign(x)sign(x)sign(x) sign(x)={+1,x⩾0

原创 【統計學習方法讀書筆記】(一)統計學習及監督學習概論

最近在面試過程中,發現對於AI算法崗位,基本的機器學習、統計學習理論的考察是非常重要的,因此決定先過一遍《統計學習方法》,爲了回顧學過的知識,以問答的形式建此博客,整理學習中的思考,也希望同道中人一起討論學習 統計學習概論

原创 【統計學習方法讀書筆記】(四)樸素貝葉斯法

終於到了貝葉斯估計這章了,貝葉斯估計在我心中一直是很重要的地位,不過發現書中只用了不到10頁介紹這一章,深度內容後,發現貝葉斯估計的基礎公式確實不多,但是由於正態分佈在生活中的普遍性,貝葉斯估計才應用的非常多吧! 默認輸入變量用

原创 【統計學習方法讀書筆記】(三)k近鄰法

個人感覺k近鄰應該是所有統計學習方法裏最好理解的了,通俗來說就是在數據集中找距離測試數據x最近的k個數據樣本,如果A類的數量大於B類的數量,則將測試數據x歸爲A類,書中也僅用了不到10頁來論述這個理論,除基本k近鄰理論,還有kd