TensorFlow的邏輯迴歸實現

原創

2020-06-23 01:00

轉載請註明出處：http://blog.csdn.net/gamer_gyt
博主微博：http://weibo.com/234654758
Github：https://github.com/thinkgamer

邏輯迴歸我們都知道是用來進行二分類處理的，裏邊經常用到的階躍函數是海維塞得階躍函數（Sigmoid函數）。

邏輯迴歸簡介

線性迴歸能對連續值結果進行預測，而現實生活中常見的另外一類問題是，分類問題。最簡單的情況是是與否的二分類問題。比如說醫生需要判斷病人是否生病，銀行要判斷一個人的信用程度是否達到可以給他發信用卡的程度，郵件收件箱要自動對郵件分類爲正常郵件和垃圾郵件等等。

當然，我們最直接的想法是，既然能夠用線性迴歸預測出連續值結果，那根據結果設定一個閾值是不是就可以解決這個問題了呢？然後在大多數情況下需要學習的分類數據並沒有那麼精準，這個時候閾值的設定就沒卵用了，這時候就需要邏輯迴歸了，邏輯迴歸的核心思想就是通過對線性迴歸的計算結果進行一個映射，使之輸出的結果爲0~1之間的概率值。

這個時候就需要一個單位階躍函數，常使用的就是Sigmoid函數。

求導之後爲：

對應的圖像爲：

更多關於邏輯迴歸的介紹可以參考之前的兩篇文章：

關於Softmax Regression

參考之前轉載的一篇文章：Softmax Regression

TF中基於LR的多分類實現

# coding: utf-8
'''
create by: Thinkgamer
create time: 2018/04/22
desc: 使用tensorflow創建邏輯迴歸模型 ，分類
'''
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

# 加載mnist數據集
from tensorflow.examples.tutorials.mnist import input_data
print("load finish")

mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)
print(type(mnist))

train_img = mnist.train.images
train_label = mnist.train.labels
print("訓練集類型：",type(train_img))
print("訓練集維度：",train_img.shape)

test_img = mnist.test.images
test_label = mnist.test.labels
print("測試集類型：",type(test_img))
print("測試集維度：",test_img.shape)
print(test_label[0])
# [0. 0. 0. 0. 0. 0. 0. 1. 0. 0.] 表示數字7

輸出爲：

load finish
Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz
<class 'tensorflow.contrib.learn.python.learn.datasets.base.Datasets'>
訓練集類型： <class 'numpy.ndarray'>
訓練集維度： (55000, 784)
測試集類型： <class 'numpy.ndarray'>
測試集維度： (10000, 784)
[0. 0. 0. 0. 0. 0. 0. 1. 0. 0.]

x = tf.placeholder("float",[None,784])
y = tf.placeholder("float",[None,10])

W = tf.Variable(tf.zeros([784,10]))  # 表示權重，784個維度，10種類別
b = tf.Variable(tf.zeros([10]))      # 表示 是10分類，這裏選用0值初始化，一般採用高斯初始化

# 表示預測值結果
actv = tf.nn.softmax(tf.matmul(x,W)+b)

# 構造損失函數
# 損失函數 -log p, 各個維度損失函數求和之後，求均值
cost= tf.reduce_mean(-tf.reduce_sum(y*tf.log(actv),reduction_indices=1))    

# Optimizer 指定優化器 梯度下降
learning_rate = 0.1
optm = tf.train.GradientDescentOptimizer(learning_rate=learning_rate).minimize(cost)

sess = tf.InteractiveSession()
# 函數學習 tf.argmax 返回最大值的索引
arr = np.array([
    [1,2,3,4,5],
    [6,7,8,9,10]
])
print(tf.shape(arr).eval())
print(tf.argmax(arr,0).eval())  #eval(session=sess))  0 是按列 1 是按行
print(tf.argmax(arr,1).eval())

# 預測
pred = tf.equal(tf.argmax(actv,1),tf.argmax(y,1))

# 準確率
accr = tf.reduce_mean(tf.cast(pred,"float"))

# init
init = tf.global_variables_initializer()

training_epochs = 50  # 樣本迭代次數
batch_size = 100 # 每次迭代使用的樣本
display_step = 50

sess = tf.Session()
sess.run(init)

# MINI-BATCH LEARENING
for epoch in range(training_epochs):
    avg_cost = 0.
    number_batch = int(mnist.train.num_examples/batch_size)
    for i in range(number_batch):
        batch_xs,batch_ys = mnist.train.next_batch(batch_size)
        sess.run(optm,feed_dict={x:batch_xs,y:batch_ys})
        feeds = {x: batch_xs,y: batch_ys}
        avg_cost += sess.run(cost,feed_dict=feeds)/number_batch
    # DISPLAY
    if epoch % display_step ==0 :
        feeds_train = {x:batch_xs,y:batch_ys}
        feeds_test = {x: mnist.test.images,y:mnist.test.labels}
        train_acc = sess.run(accr,feed_dict=feeds_train)
        test_acc = sess.run(accr,feed_dict=feeds_test)
        print(("Epoch: %03d/%03d cost:%.9f train_acc: %.3f test_acc: %.3f") % (epoch,training_epochs,avg_cost,train_acc,test_acc))
print("Done")

【技術服務】，詳情點擊查看： https://mp.weixin.qq.com/s/PtX9ukKRBmazAWARprGIAg

掃一掃關注微信公衆號！號主專注於搜索和推薦系統，嘗試使用算法去更好的服務於用戶，包括但不侷限於機器學習，深度學習，強化學習，自然語言理解，知識圖譜，還不定時分享技術，資料，思考等文章！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TensorFlow的邏輯迴歸實現

邏輯迴歸簡介

關於Softmax Regression

TF中基於LR的多分類實現

AI模型 Llama 3體驗筆記

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

獨孤九劍：算法模型訓練的一般流程

傳統機器學習和前沿深度學習推薦模型演化關係介紹

TensorFlow的邏輯迴歸實現

論文｜LinUCB論文的思想解讀、場景應用與痛點說明

常見的五種神經網絡(4)-深度信念網絡（下）篇之深度信念網絡的原理解讀、參數學習

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結