GoogLeNet Inception v1 結構及 pytorch、tensorflow、keras、paddle實現ImageNet識別

原創

2020-02-22 08:39

背景

GoogLeNet是谷歌在imageNet上的ILSVRC 2014大賽冠軍方案，論文“Going deeper with convolutions”網絡主要部分有Inception模塊組成，v1版本的核心思想是通過多個並行的稀疏結構代替密集結構，從而在擴大特徵範圍的同時減少計算量，同時使用1*1卷積再次減少卷積時的計算量。同時，在網絡中間層增加了兩個Loss，用來減弱梯度回傳消失的情況。最終使網絡的寬度和深度都有所增加.

網絡結構

藍色部分爲並行的卷積，黃色是爲降低計算量使用的1*1卷積，稱爲降維操作，紅色爲stride爲1的池化（Additionally, since pooling operations have been essential for the success in current state of the art convolutional networks, it suggests that adding an alternative parallel pooling path in each such stage should have additional beefificial effect, too）

1*1卷積降低計算量：假設inception輸入爲n*n*j，輸出爲n*n*k，原始版本中3*3卷積過程的參數量爲j*3*3*j=9*jk，降維版本中的參數量爲j*1*1*m+m*3*3*k=m(j+9k)，其中m表示1*1降維卷積的通道數，由於j、k通道數可以達到幾百甚至幾千，所以只有m不是過大，降維版本的計算量會遠小於原始版本

完整網絡結構如上圖，主體部分是inception模塊，在訓練時，在4a、4d的輸出部分添加loss輸出如下圖：

• An average pooling layer with 5×5 fifilter size and stride 3, resulting in an 4×4×512 output for the (4a), and 4×4×528 for the (4d) stage.

• A 1×1 convolution with 128 fifilters for dimension reduction and rectifified linear activation.

• A fully connected layer with 1024 units and rectifified linear activation.

• A dropout layer with 70% ratio of dropped outputs.

• A linear layer with softmax loss as the classififier (predicting the same 1000 classes as the main classififier, but removed at inference time)

代碼：

tensorflow實現

注：

以上代碼在alexnet的基礎上，實現了：

1）調用框架api讀取數據集

2）進行train、val的流程

3）在train時可以輸出各層shape

4）保存最優loss模型，並在結束時輸出最優loss及對應epoch

5）在訓練結束後查看loss、acc變化曲線

（實驗數據集）：UC Merced Land Use Dataset，常用的遙感場景分類數據集，21class * 100pic = 2100張圖片，統一爲256*256pix大小

http://weegee.vision.ucmerced.edu/datasets/landuse.html

（在pytorch上可以有有效收斂，在tensorflow、keras、paddle目前不收斂）

文件結構：my_utils.py文件存放通用函數

發佈了126 篇原創文章 · 獲贊 46 · 訪問量 8萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

打開神經網絡的黑箱子

卷積神經網絡每個卷積核提取不同的特徵。每個卷積覈對輸入進行卷積，生成一個feature map，這個feature map即體現了該卷積核從輸入中提取的特徵，不同的feature map顯示了圖像中不同的特徵。淺層卷積核提取：邊緣、顏

2024-05-06 00:41:39

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

03-爲啥大模型LLM還沒能完全替代你？

1 不具備記憶能力的它是零狀態的，我們平常在使用一些大模型產品，尤其在使用他們的API的時候，我們會發現那你和它對話，尤其是多輪對話的時候，經過一些輪次後，這些記憶就消失了，因爲它也記不住那麼多。 2 上下文窗口的限制大模型對其inpu

2024-04-23 01:07:00

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

01-大語言模型發展

AI大模型的相關的一些基礎知識，一些背景和基礎知識。多模型強應用AI 2.0時代應用開發者的機會。 0 大綱 AI產業的拆解和常見名詞應用級開發者，在目前這樣一個大背景下的一個職業上面的一些機會實戰部分的，做這個agent，即所謂智

2024-04-22 01:12:50

深入解析大模型NLP LLaMa

在人工智能和自然語言處理（NLP）領域，LLaMa（Language-Model-driven Learning, aMplification and aDAptation）流程已經成爲處理大規模模型訓練的關鍵技術。它基於語言模型的學習、增

2024-04-18 11:29:54

文檔圖像大模型

隨着信息技術的快速發展，文檔處理已經成爲日常生活和工作中不可或缺的一部分。傳統的文檔處理方法往往需要人工參與，效率低下且易出錯。近年來，隨着深度學習技術的突破，文檔圖像大模型在智能文檔處理領域嶄露頭角，爲提升文檔處理性能提供了新的解決方案。

2024-04-18 11:29:52

從零開始學習大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

2024-04-12 21:33:07

GLM國產大模型訓練加速：高效性能與成本優化的實踐

隨着人工智能技術的不斷進步，大模型的訓練成爲了推動深度學習領域發展的重要力量。然而，傳統的訓練方式往往面臨着性能瓶頸和高昂的成本問題，這使得許多研究者和開發者望而卻步。爲了解決這一難題，我們探索了使用OneFlow框架對GLM國產大模型進行

2024-05-07 23:30:09

如何基於香橙派AIpro對視頻/圖像數據進行預處理

本文分享自華爲雲社區《如何基於香橙派AIpro對視頻/圖像數據進行預處理》，作者：昇騰CANN。受網絡結構和訓練方式等因素的影響，絕大多數神經網絡模型對輸入數據都有格式上的限制。在計算機視覺領域，這個限制大多體現在圖像的尺寸、色域、歸一

2024-04-19 10:32:52

南京大學×百度“星河杯”AI 大模型創意校園賽正式起航

3 月 9 日，教育部長懷進鵬在十四屆全國人大二次會議民生主題記者會上，談到了人工智能+教育的重要性。他強調，要把人工智能技術深入到教育教學和管理的全過程和全環節，研究其有效性和適應性，讓青年一代更加主動地學習，讓教師更加創造性地教學。

2024-04-28 11:42:11

24小時熱門文章

最新文章

最新評論文章