使用NumPy实现GoogLeNet的前向检测功能

原創

2019-02-19 06:41

2014年GoogLeNet的出现，再次刷新了图像分类检测的准确率。在《Going Deeper with Convolutions》论文中，提出了Inception神经网络架构，随后又出现了Inception-v2、Inception-v3等优化的架构。与AlexNet相比，Inception架构更为复杂，不过使用Numpy实现其前向检测的运算，也是可行的。本文记录了笔者实现的这一过程。相关代码可在https://github.com/LinkYe/LearnDeep/tree/master/Inception-caffe获得。

首先，需要下载Caffe官网提供的GoogLeNet训练的权重文件，URL为http://dl.caffe.berkeleyvision.org/bvlc_googlenet.caffemodel；该文件的大小有52MB，约为AlexNet的权重文件大小的四分之一，Inception网络结构的优越性可见一斑。
然后，可以通过执行what.py脚本，查看GoogLeNet的各层权重的Tensor形状，和输出Tensor的形状。执行命令：python3 what.py > what.txt，并查看what.txt，如下图：

由上图可知，GoogLeNet的权重数量很多，结构很复杂。Blob为每层输出的Tensor的形状，BlobVec则为每一层的卷积核。论文中提出了Inception模块，并在整个前向计算中重复了多次，下面就是Inception模块计算的实现：

在方法incept(...)中，输入的pImg被多次使用到，最后将4个计算过程的输出叠加成为一个Tensor，这样看来，输出的结果是复合的，这不是一纯粹的feed-forward过程。之后，就是前向的计算过程了：

最后，可以执行python3 -i run-inception.py运行实现的GoogLeNet的检测功能了，它全自动加载cat.jpg：

见上图，我们也将caffe的结果输出了，对比可知我们的计算过程是正确的。不过由于置信度忘记乘以100，所以上面的结果差了100倍。也可以手动执行detect_img('XXX.jpg')，对图片进行检测：

至此，我们又见到了一种架构较为复杂的分类器的前向计算过程，这样以后探究其他一些更为复杂的网络了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

关于线程池优雅关闭

使用線程池的問題程序關閉時（eg. 上線），線程池中的任務會丟失（內存中）。線程池優雅關閉利用Spring中ContextClosedEvent：關閉程序觸發的事件，在使用線程池的地方，可以將線程池註冊到ThreadPoolShutd

帥氣的濤啊

2024-05-22 14:32:00

layui laydate日期时间范围，时间默认设定为23:59:59

在Layui中，如果你想設置日期時間選擇器（datetime）的默認結束時間爲當天的23:59:59，你可以使用如下代碼（紅色部分）：　　　　　　laydate.render({ elem: '#test

2024-05-22 14:30:20

Milvus向量数据库入门实践

Milvus是一個開源的向量數據庫，可以處理萬億級向量相似性搜索和分析。非結構化數據呈爆炸式增長。而我們可以通過機器學習模型，將非結構化數據轉化爲 embedding 向量，隨後處理分析這些數據。在此過程中，向量數據庫應運而生。向量

2024-05-22 14:29:39

salesforce零基础学习（一百三十八）零碎知识点小总结（十）

本篇參考： https://help.salesforce.com/s/articleView?id=release-notes.rn_apex_5level_SOQLqueries.htm&release=250&type=5 http

2024-05-22 14:29:09

通过撰写代码理解向量计算，并用于文本分类

一、原生向量代碼，自己計算距離 import numpy as npfrom numpy import dotfrom numpy.linalg import normfrom sentence_transformers import Se

2024-05-22 14:23:18

一款开源的.NET程序集反编译、编辑和调试神器

前言說到.NET相關的反編譯工具大家腦海裏第一個想到的工具是什麼？ILSpy、dnSpy、還是dotPeek？咱們今天的主要內容是講講dnSpyEx（dnSpyEx是dnSpy項目的非官方Fork維護版本）這個開源的.NET程序集反編譯、

2024-05-22 14:21:58

「Python实用秘技17」快速获取国内节假日安排

本文完整示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/PythonPracticalSkills 　　這是我的系列文章「Python實用祕技」的第17期，本系列立足於筆者日常工作中使

2024-05-22 14:21:38

FolkMq v1.4.6 发布（可以内嵌的消息中间件）

功能簡表角色功能生產者（客戶端）發佈消息、定時消息（或叫延時）、順序消息、可過期消息、事務消息。支持 Qos0、Qos1 消費者（客戶端）訂閱、取消訂閱。消費-ACK（自動、手動）服務端發

2024-05-22 14:21:18

霍夫变换和霍夫直线检测的原理

張博的博客

2024-05-22 14:19:57

两个线段距离的一个定理证明和代码实现.

複雜度O(1) #計算兩個線段之間的最短距離: #暴力遍歷兩邊所有點求點之間距離最小速度N方. import cv2,math def jiajiao(line1, line2): line1with_x_axis=math.at

張博的博客

2024-05-22 14:19:57

kimi- MarkMap 生成思维导图

1、Prompt：幫我分析《被人討厭的勇氣》這本書，從裏面總結出核心內容，要求: 1.提供 5 個主要觀點 2.每個觀點至少有 3 個支撐觀點說明 3.按照以下格式，使用markdown的代碼快格式輸出: ``` # 被人討厭的勇氣 ##

2024-05-22 14:14:57

Kimi 高效使用技巧，80%的人都不知道

Kimi 高效使用技巧，80%的人都不知道聚焦於 AI提示詞 + 職場提效。標題可能誇大或與內容不符 34 人贊同了該文章關注我, AI 學習之旅上，我與您一同成長！一、引言 Kimi 作

2024-05-22 14:14:57

keycloak~自定义认证流设置固定redirect_uri

redirect_uri在keycloak進行認證成功之後，會重定向到這個目標頁面，一般爲用戶的來源頁，即你在登錄之前訪問的頁面；自定義認證流是指對keycloak中的brower和direct grant兩個認證方式的過程添加自定義策略，

2024-05-22 14:12:37

power 740 p740 连接远程管理模块

https://111.111.111.111/ The connection for this site is not secure 111.111.111.111 uses an unsupported protocol.

2024-05-22 14:10:26

hdu4348（主席树区间修改）

Problem - 4348 (hdu.edu.cn) BackgroundTo The Moon是一款獨立遊戲，於2011年11月發佈，是一款由RPG Maker提供支持的角色扮演冒險遊戲。《去月球》的前提是基於一種技術，該技術使我們能

2024-05-22 14:10:26

24小時熱門文章

Python实现大麦网抢票的四大关键技术点解析

最新文章

最新評論文章