機器學習之開篇

機器學習,本質來講,就是基於大數量的數據,尋找一種規律。然後根據找尋出的規律將未知目標值的數據確認目標值的過程。期間涉及到了數據,算法。近幾年由於計算機硬件的升級,大規模計算成爲可能,所以機器學習又開始興起。

數據

數據是學習的來源,起初你拿到的是一堆陌生的數據,老闆可能給你一項任務,目標是在這一堆數據中確認某一項信息,比如,圖像識別,給你一堆圖片驗證碼,讓你確認驗證碼裏的字符。
起初的數據是不合適學習的,需要對其進行處理加工,圖片驗證碼是圖片,而且有干擾線的多個字符,那我們需要做的可能是去除干擾線並切割成單一字符。

訓練數據、測試數據及未知數據

數據主要有兩部分:給你的數據對應着目標信息則稱爲訓練數據和測試數據,需要確認目標信息的數據則爲未知數據。
訓練數據就是單個字符驗證碼的圖片,並標有確認字符值。測試數據亦是。未知數據就是那些待確認的圖片驗證碼了。

尋找合適的算法

選擇哪一個算法來訓練數據呢,監督學習中,簡單的分類可選KNN,等等待完善

測試數據測試算法的準確度

預測未知數據的目標信息

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章