原创 【caffe】可視化網絡的訓練過程的loss和accuracy(效果由於官方繪製腳本)

前言:我們在訓練網絡的時候,網絡訓練完畢後,需要可視化訓練過程中loss和accuracy的變化情況,方便了解整個訓練過程模型的優化情況。(之前使用caffe自帶的腳本繪製曲線圖,出現各種報錯,遂採用python腳本來繪製曲線。) 1、保

原创 【pytorch】pytorch模型轉libtorch模型

https://blog.csdn.net/seasermy/article/details/99677789

原创 【記事本】mobilenet相關資料收集

sp2823---官方github地址上的conv_dw層修改: https://github.com/BVLC/caffe/pull/5665/files#diff-4f402e0933af71910feb2a9d38eaf2e6R1

原创 【deeplearning基礎知識】Momentum優化是如何計算的

mini-batch SGD訓練算法的問題:1)雖然能夠帶來很好的訓練速度,但是在到達最優點的時候並不能夠總是真正到達最優點,而是在最優點附近徘徊。容易產生一些震盪。 2)採用小的學習率的時候,會導致網絡在訓練的時候收斂太慢;當我們採用大

原创 【caffe】使用python腳本訓練分類模型,並可視化Loss和Accuracy.

PS:這裏不是使用caffe默認的終端調用訓練指令,而是使用python腳本來進行網絡訓練,並在網絡訓練完畢後顯示訓練過程的loss和accuracy。 詳細腳本如下: 1)需要修改的變量: cafferoot=‘caffe根目錄’ so

原创 【工具】wget下載指令

wget, 一個強大的下載命令。 下面以下載coco數據爲例,展示wget的各種小方法。 1、從網站下載一個文件。 wget http://images.cocodataset.org/zips/train2017.zip   2、下載中

原创 【Linux】VIM的基本使用

1、vim基本使用 翻頁操作: Ctrl+F(PageDown):下翻一屏 Ctrl+B(PageUp):上翻一屏G:移到緩衝區最後一行 num G:移到緩衝區第num行gg:移到緩衝區第一行 保存退出: (需要在前面加入一個冒號:進入指

原创 【工具腳本】目標檢測數據樣本的擴增腳本

參考自:https://blog.csdn.net/Mr_health/article/details/82667538 原文中,writeXml(anno_new_dir, new_img_name, W, H, D, gt_new)的

原创 【工具腳本】修改VOC格式XMl文件的label名稱

 腳本如下:人很話不多,如果提示no module xxxxxxx ,缺啥裝啥。 #!/usr/bin/env python2 # -*- coding: utf-8 -*- import os import xml.etree.El

原创 【Linux】Ubuntu創建軟鏈接

創建軟鏈接: ln -s [源文件或目錄] [目標文件或目錄] 例子: #生成軟鏈接,如果需要創建root權限,加上sudo sudo ln -s libcudnn.so.7 libcudnn.so   注意: 1、創建完了可以在目標文

原创 【目標檢測】COCO數據集下載鏈接

一、下載鏈接 [1] - train2014 images: (13GB) http://images.cocodataset.org/zips/train2014.zip [2] - val2014 images:(6GB) http:

原创 【目標檢測】YOLO系列檢測算法

IoU(Intersection-over-Union)指標 IoU 簡稱交併比,顧名思義數學中交集與並集的比例。假設有兩個集合 A 與 B, IoU 即等於 A 與 B 的交集除以 A 與 B 的並集,表達式如下: 在目標檢測中,Io

原创 【Error】python中出現ValueError: invalid literal for int() with base 10: '262.419157788'

出現該錯誤主要時再將字符串轉換爲int類型時,是由於string類型變量轉換爲int時出現異常,這裏顯示的是將字符串'262.419157788'轉換爲int類型出現問題。 解決辦法:再將float的字符串轉換爲int類型時,先將str

原创 【視頻行爲識別8】SlowFast Networks for Video Recognition快慢雙通道網絡(CVPR2019)

背景:          作者通過觀察發現一個問題:視頻場景中的幀通常包含兩個不同的部分 —> 不怎麼變化或者緩慢變化的靜態區域和正在發生變化的動態區域(此區域一般爲視頻中行爲發生的重要處)。例如,飛機起飛的視頻會包含相對靜態的機場和一個

原创 【視頻行爲識別3】C3D:使用3D卷積網絡學習時空特徵(2015)

3D卷積和池化 觀點: 1)只有3D卷積才能保留輸入信號的時間信息,相同的現象適用於2D和3D池化. 2)雖然以前一些時間流網絡採用多個幀作爲輸入,但是由於2D卷積,在第一卷積層之後,時間信息完全消失了。   2D與3D卷積之間的區別: