機器學習(Machine Learning)和傳統的數據統計(Data Statistics)有什麼區別?
機器學習
- 強調預測
- 通過預測性能評估結果
- 關注過度擬合而不是模型本身的複雜性
- 注重表現
- 通過在新數據集上的性能獲得可概括性
- 通常,沒有指定超人口模型
- 對性能和健壯性的關注
傳統統計分析
- 強調超總體推斷
- 關注a-先驗假設
- 更簡單的模型優於複雜的模型(簡約),即使更復雜的模型性能稍好
- 重視參數解釋能力
- 統計建模或抽樣假設將數據連接到感興趣的總體
- 對假設和穩健性的關注
上一節我們講了數據清晰的內容,通過清晰我們保留了正常的數據,在處理特徵預處理內容之前,我們先要確定標註,反應目的的屬性就是標註,其他有關係的特徵