AI系統構建流程1
要構建一個AI系統或產品,你要處理好5個核心環節,我們通常稱之爲“機器學習工作流”。
這些步驟分別是:
- 數據收集與分析
- 數據準備
- 模型構建
- 模型驗證與測試
- 模型部署
1.分析你的數據,提前回答一些策略性的問題
以下是一些常用方法:
- 檢查異常值;
- 尋找數值關係和點相關性;
- 評估缺失值的數量。
2. 數據準備
如果原始數據存在干擾,不能用來訓練學習算法。這時,你就需要進行數據清理和數據準備,常用方法包括:
- 合併表格;
- 提取新特徵;
- 處理上步中確定的缺失值和異常值等;
- 清潔數據,並根據情況進行標準化。
3. 模型構建
這是最快完成的一部分,你可以多嘗試一些算法,誰也不知道哪個算法的效果最好。大多數機器學習模型只需要幾行代碼就能實現。你可以:
- 根據當前的數據特性來選擇一系列算法;
- 嘗試不同超參數的效果或是運行自動參數調優。
4. 模型驗證與測試
這包括兩部分:
- 首先,你顯然需要驗證當前模型的輸出是否滿足實際要求。該如何驗證模型取決於當前使用的機器學習方法,是有監督、無監督還是強化學習。在這個過程中,你要平衡好靈敏度和特異度,精確度和召回率,或是某種聚類有效性等指標間的關係。
- 其次,現有的統計數據不足以驗證這個模型是否滿足要求,你就要去驗證下用戶輸出,比如說用你自己做個實驗,看看你作爲用戶裏能否靠產品的輸出來進行操作,會不會想進行操作?