超級簡單的機器學習入門

   最近正好在接觸機器學習,自己在網上看了好幾天的資料,現在進行一個小小的總結;而機器學習是什麼呢?

   簡單的來說:機器學習就是你把相同數據給很多機器消化,可以一次給一大堆,也可以一次一次的給,也就是我們經常說的離線訓練和在線訓練;然後選擇能達到你想要結果最好的那臺機器,就是我們的模型;而整個過程就是機器學習;

  而機器學習最重要的三步就是:數據處理、訓練、部署

開發語言:python(裏面有很多模塊、庫也一定要多瞭解)

常用的開發環境:pycharm、JupyterLab

在JupterLab和pycharm開發的區別: 在Jupter上執行的命令會保存在緩存中,分段調試時候可一段一段執行;而pycharm上需要重新從最開始執行一次;並且jupter是一種可視化的web開發;

新手做機器學習的5個步驟:

(每一個步驟涉及到很多的算法和方法,只能自行了解哦)

1. 獲取訓練數據

2. 數據探索及預處理

3. 訓練模型及模型選擇

4. 保存模型

5. 撰寫預測腳本

訓練:

在離線訓練中,所有的訓練數據在模型訓練期間必須是可用的。只有訓練完成了之後,模型才能被拿來用。簡而言之,先訓練,再用模型,不訓練完就不用模型。

離線學習,通常是用來訓練大的或者複雜的模型,因爲訓練的過程往往比較耗時,處理數據量大,無法在線完成

傳統的有監督和無監督等機器學習模型,如 KNN、SVM、Naive Bayes、決策樹、GBDT、K-means 等模型;

部署:

在線模型服務--機器學習模型應用的最後一公里 在線模型服務功能支持用戶將訓練完成的機器學習模型發佈爲實時接口,進而可以直接應用於線上的業務系統,解決機器學習模型應用於生產的最後一公里問題。用戶只需要撰寫python版的預測函數,系統會自動封裝併發布爲JSF接口,大大降低接口發佈門檻,提高機器學習模型研發效率。

 模型部署 是將一個調試好的模型應用置於生產或者類生產環境中,其意義在於處理預測新數據,爲公司提供數據決策或者對接其他需求部門提供模型支持。

 

發佈了12 篇原創文章 · 獲贊 18 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章