从组合中估计概率

原創

上进的菜鸟

2020-06-23 20:09

一些分类算法缺乏输出结果为概率的能力，比如rf

这个时候使用calibratedclassifiercv，它使用2种方法将分类结果转化为概率

第一种：platte的归类方法

第二种：isotonic回归

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.calibration import CalibratedClassifierCV,calibration_curve
hypothesis = RandomForestClassifier(n_estimators=100,random_state=101)
calibration = CalibratedClassifierCV(hypothesis,method='sigmoid',cv=5)
# sigmoid代表platt方法
covertype_X = covertype_dataset.data[:15000,:]
covertype_y = covertype_dataset.target[:15000]
covertype_test_X = covertype_dataset.data[15000:25000,:]
covertype_test_y = covertype_dataset.target[15000:25000]

hypothesis.fit(covertype_X,covertype_y)
calibration.fit(covertype_X,covertype_y)
prob_raw = hypothesis.predict_proba(covertype_test_X) # 原始的随机森林概率
prob_cal = calibration.predict_proba(covertype_test_X) # 概率校正

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

西瓜书——第三章课后习题

題3.1 試析在什麼情況下f(x)=w^(T)+b中不必考慮偏置項b 首先要知道爲什麼要加偏置項？它的作用是什麼？在之前學過的一次函數中，b其實就是函數在y軸的截距，控制着函數偏離原點的距離，那麼在線性模型中應該也是類似作用。

2020-07-03 18:22:22

西瓜书之决策树的一生

最近看西瓜書的決策樹這一章，給我看懵了。感覺得自己動手一步一步計算才能理解具體怎麼構造的，然後才能寫程序。就以書上的西瓜集2.0爲例： 1.先搞清兩個概念：信息熵和信息增益信息熵越小，純度越高。計算公式如下：條件熵：

2020-07-03 18:22:22

lesson-03-多维向量版本 (1)

import numpy as np import random class Node: def __init__(self, inputs=[]): self.inputs = inputs

2020-07-01 16:39:30

Lecture-02-Search-Policy-and-Simple-Machine-Learning

問題描述大家好，我們在用 networkx 顯示中文的時候，會發現不能顯示中文。解決辦法下載Github倉庫中的字體SimHei.ttf；在 jupyter notebook 中執行 import matplotlib

2020-07-01 16:39:29

机器学习笔记——绪论

機器學習基本概念定義：致力於研究如何通過計算的手段，利用經驗來改善系統自身的吸能。研究的主要內容他:在計算機上從數據中產生“模型”的算法，可以說機器學習是研究關於“學習算法”的學問基本術語要進行機器學習，先要有數據，通

weixin_43249938

2020-06-30 22:08:02

再学西瓜书----chapter6 支持向量机SVM

Page 121~Page 123 比較好的推文可以參考這篇，講的比西瓜書詳細關於svm的推導不準備贅述了，這裏只注重結論，超平面 wTx+ b = 0 對於線性可分的情況，超平面其實是我們需要求的東西支持向量就是離超平面

2020-06-29 23:11:09

周志华《机器学习》（西瓜书）学习笔记——第五章神经网络

2020-06-26 05:15:42

周志华《机器学习》（西瓜书）学习笔记——第十章降维与度量学习

2020-06-26 05:15:42

周志华《机器学习》（西瓜书）学习笔记——第八章集成学习

2020-06-26 05:15:42

周志华《机器学习》（西瓜书）学习笔记——第六章支持向量机

2020-06-26 05:15:42

【和我一起学西瓜书】机器学习各章节思维导图（更新中）

2020-06-25 20:46:38

【和我一起学西瓜书】1.绪论-术语列表

重要術語：記錄 / 樣本（sample）/ 示例（instance）數據集（data set）屬性（attribute）/ 特徵（feature）屬性值（attribute value）屬性空間（attribute s

2020-06-25 19:19:58

【和我一起学西瓜书】没有免费的午餐定理NFL

關於沒有免費的午餐定理的證明，推薦兩篇博客： https://blog.csdn.net/weixin_41370083/article/details/81666357 https://blog.csdn.net/u013238

2020-06-25 19:19:41

异常检测实战

數據科學導論 python語言實現一、單變量異常檢測（一次觀測一個變量） 1.1 Z-scores 得分絕對值超過3的 1.2 箱線圖 import numpy as np from sklearn import preproce

上进的菜鸟

2020-06-23 20:09:29

【西瓜书框图笔记07】第八章——集成学习

达瓦里氏吨吨吨

2020-06-23 10:19:23

24小時熱門文章

最新文章

最新評論文章