原创 機器學習中的多類別分類和多標籤分類

多類別分類(Multiclass Classification) 一個樣本屬於且只屬於多個類中的一個,一個樣本只能屬於一個類,不同類之間是互斥的。 多標籤分類(Multilable classification) 多標籤分類又稱多標籤學習

原创 [機器學習]------特徵選擇常用方法整理

https://blog.csdn.net/SecondLieutenant/article/details/80693765

原创 方差的偏差的區別

想象你開着一架黑鷹直升機,得到命令攻擊地面上一隻敵軍部隊,於是你連打數十梭子,結果有一下幾種情況: 子彈基本上都打在隊伍經過的一棵樹上了,連在那棵樹旁邊等兔子的人都毫髮無損,這就是方差小(子彈打得很集中),偏差大(跟目的相距甚遠)。 子彈

原创 我所理解的mobile Net

MobileNetV1就是把VGG中的標準卷積層換成深度可分離卷積就可以了。 Mobile Net採用了深度可分離卷積。 深度可分離卷積分爲逐深度卷積和逐點卷積。 逐深度卷積的通道數爲1,卷積核數量爲輸入特徵圖的通道數。每個卷積核分別與輸

原创 bagging、boosting總結

方差、偏差與bagging、boosting的關係 偏差指的是算法的期望預測與真實值之間的偏差程度,反映了模型本身的擬合能力; 方差度量了同等大小的訓練集的變動導致學習性能的變化,刻畫了數據擾動所導致的影響。 當模型越複雜時,擬合能力就越

原创 爲什麼faster-rcnn的識別精度要高於yolov3?

yolov3(one-state)和faster-rcnn(two-stage)的表現差異主要原因是:                 1、大量前景(positive)和背景(negative)數量不平衡導致。              

原创 YOLOv1、YOLOv2、YOLOv3概括總結

                                                         Yolov1 參考資料鏈接:https://www.jianshu.com/p/cad68ca85e27 將一幅圖像分成S*

原创 sklearn-特徵提升之特徵提取-----DictVectorizer

DictVectorizer的處理對象時符號化(非數字化)的但是具有一定結構的特徵數據,如字典等,將符號轉成數字0/1表示。 test_dict = [{'name':'zhang','old':23},{'name':'wang','

原创 第二週:Python數據分析基礎

Python基礎: 1、Python環境安裝(anaconda); anaconda是python的包管理器和環境管理器。 Anaconda附帶了一大批常用數據科學包,它附帶了conda、Python和 150 多個科學包及其依賴項。因此

原创 第一週:數據的描述性統計

學習計劃:第一週 一、本週學習內容: 知識點: 數據的描述性統計 主要包括: 1、數據的集中趨勢: 衆數、中位數、平均數、分位數、極差; 算

原创 機器學習解決應用問題的一般步驟(筆記)

第一步:識別問題        首先明確這個問題是分類還是迴歸,通過問題和數據就可以判斷出來,數據由X和label列構成,label可以一列也可以多列,可以是二進制也可以是實數。當它爲二進制時,問題屬於分類,當它爲實數時,問題屬於迴歸。

原创 神經網絡與遺傳算法

        神經網絡是用來處理非線性關係的,輸入和輸出之間的關係可以確定(存在非線性關係),可以利用神經網絡的自我學習(需要訓練數據集用明確的輸入和輸出),訓練後權值確定,就可以測試新的輸入了。 遺傳算法是用來解決最值問題的,生物進化

原创 adaboost和GBDT

        adaboost提高那些被前一輪分類器錯誤分類樣本的權值,而降低那些被正確分類樣本的權值。這樣一來,那些沒有得到正確分類的數據,由於其權值的加大而受到後一輪的弱分類器的更大關注。第二,adaboost採取加權多數表決的方法

原创 python知識點總結

1、當我們定義一個class的時候,我們實際上就定義了一種數據類型。我們定義的數據類型和python自帶的數據類型,比如str、list、dict沒什麼兩樣。  

原创 每日知識點總結

1、三種主要的降維技術:主成分分析;因子分析;獨立成分分析。 2、主成分分析(PCA): 優點:降低數據的複雜性,識別最重要的多個特徵。 缺點:不一定需要,且可能損失有用信息。 主要步驟:去除平均值                   計