谷歌雲 AI 平臺整合 what-if 工具

近日,谷歌宣佈其雲AI平臺整合What-If工具。這是一個基於代碼的數據科學開發環境,允許數據科學家在他們的人工智能平臺上分析模型。現在, 客戶可以把What-If工具用於部署在AI平臺上的XGBoost和Scikit Learn模型。

去年,谷歌的TensorFlow團隊推出了What-If工具,這是一個交互式的可視化接口,旨在幫助數據科學家可視化他們的數據集,更好地理解TensorFlow模型的輸出。現在,這個工具已不再侷限於TensorFlow,它開始支持XGBoost和Scikit Learn模型。數據科學家可以通過AI平臺筆記本、Colab筆記本或本地的Jupyter筆記本來使用這個新集成的工具。

通過這個工具,數據科學家無需編寫任何代碼就可以調整各種數據點,並分析模型的執行過程。同時,他們還可以在同一數據集上同時測試兩個不同的人工智能模型的性能,他們也可以檢查單個數據點或整個數據集切片,從而進行更深程度地對比和比較。此外,他們還可以:

  • 使用Facets Dive函數來對比同一數據集上不同人工智能模型的性能表現,並創建自定義的可視化
  • 通過將推理結果組織成混淆矩陣、散點圖或柱狀圖來檢查單個模型的性能
  • 通過添加或刪除特徵來編輯數據點,以運行對AI模型性能的健壯測試

谷歌決策智能實驗室的負責人Cassie Kozyrkov在她的博客(towardsdatascience)中寫道:

儘管What-If工具不是爲初學者設計的(你需要了解一些基本的知識,而且最好不要把它當作Python或筆記本的入門練習),但對於實踐分析師和機器學習工程師來說,它是一個了不起的加速器。

爲了使用這種新的集成,數據科學家首先需要通過gcloud CLI進行訓練,然後將模型部署到谷歌雲AI平臺上。接下來,數據科學家可以通過設置一個WitConfigBuilder對象在What-If工具中查看它在一個數據集上的性能。

config_builder=(WitConfigBuilder(test_examples)
 .set_ai_platform_model('your-gcp-project','gcp-model-name','model-version')
 .set_target_feature('thing-to-predict')
WitWidget(config_builder)

所有測試樣本都是模型所期望的格式,無論是JSON字典列表、JSON列表還是包括真值(ground truth)標籤的tf.Emample protos 。這些樣本可以讓我們探索不同特徵對模型預測的影響。

數據科學家看到的第一個視圖是數據點編輯器(Datapoint Editor),它顯示所提供數據集的所有樣本以及通過模型進行預測的結果。此外,通過主面板中的這個編輯器,數據科學家可以更改關於數據點的任何內容,並通過模型重新運行它,來查看這些更改是如何影響預測結果的。

而通過下一個選項卡Performance + Fairness,數據科學家可以查看整個數據集的聚合模型結果。此外,谷歌雲平臺的開發者Sara Robinson在博客中寫道:

你可以通過特徵對數據集進行切片,並在這些數據切片之間進行性能比較,確定模型表現最好或最差的數據子集,這對機器學習的公平性調查非常有幫助。

最後,更多關於What-If工具功能的內容可參考入門指南技術文檔

原文鏈接:

Google Adds New Integrations for the What-If Tool on Their Cloud AI Platform

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章