sparse_categorical_crossentropy和SparseCategoricalCrossentropy的用法區別

原創

\ (•◡•) /Carry_Meee

2020-05-20 21:00

本文主要介紹兩個函數SparseCategoricalCrossentropy和sparse_categorical_crossentropy的區別。
這兩個函數的功能都是將數字編碼轉化成one-hot編碼格式，然後對one-hot編碼格式的數據（真實標籤值）與預測出的標籤值使用交叉熵損失函數。

先看一下官網給出的對於兩個函數定義：

tf.keras.losses.SparseCategoricalCrossentropy(
from_logits=False, reduction=losses_utils.ReductionV2.AUTO,
name=‘sparse_categorical_crossentropy’)
tf.keras.losses.sparse_categorical_crossentropy(
y_true, y_pred, from_logits=False, axis=-1)

函數定義中，最明顯的區別是sparse_categorical_crossentropy中在參數中指定y_true（真實標籤值）以及y_pred（預測標籤值）。
具體用法參照以下兩段代碼：

import tensorflow as tf
import numpy as np
y_true = tf.constant([1, 2])
y_pred = tf.constant([[0.05, 0.95, 0], [0.1, 0.8, 0.1]])
loss = tf.reduce_mean(tf.keras.losses.sparse_categorical_crossentropy(y_true, y_pred))
scce = tf.keras.losses.SparseCategoricalCrossentropy()

print(loss.numpy())
print(scce(y_true, y_pred).numpy())

運行結果如下：
sparse_categorical_crossentropy需在參數的部分指定y_true和y_pred
SparseCategoricalCrossentropy在調用部分指定y_true和y_pred

接下來，再對這兩個函數的參數進行簡單描述：

SparseCategoricalCrossentropy

reduction=‘auto’，這個參數是進行最後的求平均，如果是設置爲losses_utils.ReductionV2.None，就不會求平均了

# 設置爲reduction='none'
scce = tf.keras.losses.SparseCategoricalCrossentropy(reduction='none')
# 輸出結果是：
# [0.05129344 2.3025851 ]
# 設置爲reduction='auto'
scce = tf.keras.losses.SparseCategoricalCrossentropy(reduction='auto')
# 輸出結果是求平均後的結果：
# 1.1769392

from_logits
from_logits=False, 指出進行交叉熵計算時，輸入的y_pred是否是logits，logits就是沒有經過softmax激活函數的fully connect的輸出，如果在fully connect層之後經過了激活函數softmax的處理，那這個參數就可以設置爲False

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

解讀注意力機制原理，教你使用Python實現深度學習模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

Deep Reinforcement Learning製作遊戲AI初探

參考github案例，通過 Deep Reinforcement Learning（DQN算法）訓練能玩貪喫蛇的AI。環境搭建基於python + tenso

2023-03-27 00:45:40

Keras快速搭建深度殘差收縮網絡（及深度殘差網絡）

從本質上講，深度殘差收縮網絡屬於卷積神經網絡，是深度殘差網絡（deep residual network, ResNet）的一個變種。它的核心思想在於，在深度學習進行特徵學習的過程中，剔除冗餘信息是非常重要的；軟閾值化是一種非常靈活的、刪除

2021-12-25 21:44:26

Tensorflow的圖像操作

圖像數據解析圖像編碼 import tensorflow as tf import base64 if __name__ == "__main__": path = "/Users/admin/Documen

2021-12-25 21:23:45

TextCNN模型詳細解析(2017年知乎競賽第一名架構)

目錄 1. 模型原理 1.1 論文 1.2 網絡結構 2. 實現回到頂部 1. 模型原理 1.1 論文 Yoon Kim在論文(2014 EMNLP) Convolutional Neura

2021-12-25 21:15:52

基於tensorflow2對於fashion_mnist進行分類

import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as npimport sklearnimport pandas as pdimport osimpor

2021-12-25 21:15:37

10分鐘看懂深度殘差收縮網絡

深度殘差網絡ResNet獲得了2016年IEEE Conference on Computer Vision and Pattern Recognition的最佳論文獎，目前在谷歌學術的引用量已高達38295次。深度殘差收縮網絡是深度殘差

2021-12-25 21:12:12

Tensorflow技術點整理

我們用tensorflow2來看一個服飾數據集的識別。 import numpy as np import matplotlib.pyplot as plt import tensorflow as tf from tensor

2021-10-21 21:19:52

【深度學習】類別激活熱圖可視化

↑↑↑點擊上方藍字，回覆資料，10個G的驚喜導讀使用Keras實現圖像分類中的激活熱圖的可視化，幫助更有針對性的改進模型。類別激活圖(CAM)是一種用於計算機視覺分類任務的強大技術。它允許研究人員檢查被分類的

機器學習算法與Python實戰

2021-08-03 21:13:18

深度學習“四大名著”發佈！Python、TensorFlow、機器學習、深度學習四件套（附免費下載）

Python 程序員深度學習的“四大名著”：這四本書着實很不錯！我們都知道現在機器學習、深度學習的資料太多了，面對海量資源，往往陷入到“無從下手”的困惑出境。而且並非所有的書籍都是優質資源，浪費大量的時間是得不償失的。給大家推薦這

機器學習算法與Python實戰

2021-08-02 21:14:05

Milvus 與 ONNX 格式的多種模型結合應用

開放神經網絡交換（Open Neural Network Exchange，簡稱 ONNX）是一個開放的生態系統，它提供了基於人工智能模型的一種開源格式。自 2017 年開源以來，ONNX 在短短几年時間內發展爲表示人工智能模型的實

2021-07-29 21:34:44

常用構建數據科學應用程序的七個Python庫

當我開始學習數據科學的旅程時，這些都是我腦海中一直存在的問題。我學數據科學的目的不僅僅是爲了開發模型或清理數據，我想製作人們可以使用的應用程序，我正在尋找一種快速的方法來製作MVP(最小可行產品)來測試想法。如果你是一名數據科

Linux就該這麼學

2021-05-10 21:22:25

Python，真的好用嗎？

過去的一整年全網都在說 Python ，短視頻平臺、朋友圈廣告、博主推薦哪哪都是！風這麼大！Python到底是炒作還是真不錯呢？除了生孩子 Python還有什麼不會的

2021-04-16 21:11:54

BytePS is a high performance and general distributed training framework

BytePS（https://github.com/bytedance/byteps） is a high performance and general distributed training framework. It support

2021-03-22 21:24:46

矩池雲上cifar10使用說明

矩池雲將 keras 預訓練模型保存目錄爲 /public/keras_pretrained_model/ 使用方法：先執行命令，創建目錄 mkdir -p ~/.keras/models/ 然後將預訓練模型複製進去。但是其中因爲c

2021-02-18 21:13:57

24小時熱門文章

Wireshark 安裝+使用（一）

最新文章

最新評論文章