sklearn 使用軟標籤進行多標籤、多分類訓練的一種實現方法

目標場景

Multilabel classifcation in sklearn with soft (fuzzy) labels。
在sklearn中，使用軟標籤（one-hot標籤：(1,0,0),軟標籤:(0.8,0.2,0)）進行多標籤分類問題。

解決方案

神經網絡的訓練方式（例如使用交叉熵作爲損失函數時）是直接支持使用軟標籤訓練的。
對於sklearn中的部分基礎機器學習分類模型，無法直接支持軟標籤訓練。
一個解決方案是，轉化爲迴歸問題解決，結合sklearn中MultiOutputRegressor 類。

樣例代碼

import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.multioutput import MultiOutputRegressor
# 100 個樣本 ， 50個特徵 ， 5個標籤
X_train = np.random.random((100,50))
y_train = np.random.random((100,5))

max_depth = 30
regr_multirf = MultiOutputRegressor(RandomForestRegressor(n_estimators=100,
                                                          max_depth=max_depth,
                                                          random_state=0))
regr_multirf.fit(X_train, y_train)
# 10個測試樣本
X_test = np.random.random((10,50))
X_test_predict=regr_multirf.predict(X_test)

說明

測試環境：sklearn 0.22.2 python 3.6
這種方案只是目前測試的一個可能方案，有不妥之處或者有其他解決方案歡迎指出。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

sklearn 使用軟標籤進行多標籤、多分類訓練的一種實現方法

目標場景

解決方案

樣例代碼

說明

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（一）部署K8s

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（三）數據卷掛載NFS（網絡文件系統）

CS224n(2019):Assignment2 參考答案

linux系統三步解決matplotlib圖片中文顯示問題

Leetcode-695.最大島嶼面積（DFS 與 BFS 解法，python3）

從零開始實現核密度估計（kernel density estimation，KDE）-python實現

linux磁盤掛載教程

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結