項目名稱:Causal ML: A Python Package for Uplift Modeling and Causal Inference with ML
項目名稱:Causal ML:使用機器學習進行提升建模和因果推理的Python包
CausalML是uber的開源項目,用於使用機器學習方法進行提升建模和因果推理方法。它允許用戶從實驗或觀察數據估計條件平均治療效果(CATE)或個體治療效果(ITE)。
從本質上講,它可以估計具有觀察特徵X的用戶T對結果Y干預的因果關係,而無需對模型形式做出強烈假設。
典型的用例:
- 廣告系列定位優化:在廣告系列中提高投資回報率的重要手段是將廣告定位到在給定的KPI(例如參與度或銷售)方面具有良好響應的一組客戶。CATE通過根據A / B實驗或歷史觀察數據在各個級別上的廣告展示來評估KPI的影響,從而識別這些客戶。
- 個性化參與:公司有多種與客戶互動的選擇,例如在向上銷售或通訊渠道中選擇不同的產品。可以使用CATE來評估每個客戶的異質治療效果以及最佳個性化推薦系統的治療選項組合。
該軟件包當前支持以下方法
1.基於樹的算法
(1).基於KL散度、歐幾里得、卡方等計算距離公式的提升樹/隨機森林
(2).基於情境處理選擇的提升樹/隨機森林
注:提升樹方法由一組使用基於樹的算法的方法組成,其中分裂標準基於提升的差異。
2.元學習器算法
(1).S-learner
(2).T-learner
(3).X-learner
(4).R-learner
注:
- 元算法(或元學習器)是使用任何機器學習估計器(稱爲基礎學習器)估計條件平均治療效果(CATE)的框架。
- 元算法使用一個單一的基礎學習器,同時將治療指標作爲特徵(例如S學習器),或針對每個治療組和對照組分別使用多個基礎學習器(例如T學習器,X學習器和R-學習器)學習者)。
- 元學習器通常是循環網絡,以便記住之前是如何校正學習器模型的。元學習器:將學習問題分爲兩個任務,第一個任務是在單獨數據集中快速獲取知識,第二個任務是爲了指導第一個任務,即慢慢地提取所有任務中學習到的精華。元模型是爲了更好地泛化和適應新問題。
可解釋Causal ML:
Causal ML提供了以下方法來解釋經過訓練的治療效果模型:
元學習器哪些特徵重要:
示例:
提升樹可視化: