(模型選取)Fitting a Model to Data

  1. 我們常常需要將數值變量正規化(normalize

 

  1. 線性分類器直觀的理解是屬性值的加權和(weightedsum

 

  1. 模型比較
  • Support Vector Machine
  • Linearregression
  • logisticsregression

共同點:都是擬合一個線性模型

不同點:使用不同的目標函數(CostFunction /LossFunction並最優化該目標函數(optimization

 

  1. 直觀地理解SVM(支撐向量機)
  • 兩個類別之間最寬的條帶
  • 線性分界就是中間的線
  • 目標是最大化邊界(Margin
  • 邊界大了可以給樣本點更多的空間(leeway
  • SVM是在最大邊界和較低的錯誤懲罰之間權衡
  • SVM分類器不一定要將每一個點都分對(有容錯性

 

  1. 比較分類樹(classificationtree)和線性分類器(linearclassifier
  • 分界面的區別

Classificationtree

Linearclassifier


屬性使用方式的區別
  • 分類樹每次使用一個屬性
  • 線性分類器是所有屬性的加權組合
  1. 邏輯斯蒂迴歸函數的推導(sigmoid function)
  • Probability

    Odds

    Log-odds

    0.5

    50:50 or 1

    0

    0.9

    90:10 or 9

    2.19

    0.999

    999:1 or 999

    6.9

    0.01

    1:99 or 0.0101

    4.6

    0.001

    1:999 or 0.001001

    6.9

  • 基於上述表格我們可以進行逆過程


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章