原创 【caffe】可視化網絡的訓練過程的loss和accuracy(效果由於官方繪製腳本)
前言:我們在訓練網絡的時候,網絡訓練完畢後,需要可視化訓練過程中loss和accuracy的變化情況,方便了解整個訓練過程模型的優化情況。(之前使用caffe自帶的腳本繪製曲線圖,出現各種報錯,遂採用python腳本來繪製曲線。) 1、保
原创 【pytorch】pytorch模型轉libtorch模型
https://blog.csdn.net/seasermy/article/details/99677789
原创 【記事本】mobilenet相關資料收集
sp2823---官方github地址上的conv_dw層修改: https://github.com/BVLC/caffe/pull/5665/files#diff-4f402e0933af71910feb2a9d38eaf2e6R1
原创 【deeplearning基礎知識】Momentum優化是如何計算的
mini-batch SGD訓練算法的問題:1)雖然能夠帶來很好的訓練速度,但是在到達最優點的時候並不能夠總是真正到達最優點,而是在最優點附近徘徊。容易產生一些震盪。 2)採用小的學習率的時候,會導致網絡在訓練的時候收斂太慢;當我們採用大
原创 【caffe】使用python腳本訓練分類模型,並可視化Loss和Accuracy.
PS:這裏不是使用caffe默認的終端調用訓練指令,而是使用python腳本來進行網絡訓練,並在網絡訓練完畢後顯示訓練過程的loss和accuracy。 詳細腳本如下: 1)需要修改的變量: cafferoot=‘caffe根目錄’ so
原创 【工具】wget下載指令
wget, 一個強大的下載命令。 下面以下載coco數據爲例,展示wget的各種小方法。 1、從網站下載一個文件。 wget http://images.cocodataset.org/zips/train2017.zip 2、下載中
原创 【Linux】VIM的基本使用
1、vim基本使用 翻頁操作: Ctrl+F(PageDown):下翻一屏 Ctrl+B(PageUp):上翻一屏G:移到緩衝區最後一行 num G:移到緩衝區第num行gg:移到緩衝區第一行 保存退出: (需要在前面加入一個冒號:進入指
原创 【工具腳本】目標檢測數據樣本的擴增腳本
參考自:https://blog.csdn.net/Mr_health/article/details/82667538 原文中,writeXml(anno_new_dir, new_img_name, W, H, D, gt_new)的
原创 【工具腳本】修改VOC格式XMl文件的label名稱
腳本如下:人很話不多,如果提示no module xxxxxxx ,缺啥裝啥。 #!/usr/bin/env python2 # -*- coding: utf-8 -*- import os import xml.etree.El
原创 【Linux】Ubuntu創建軟鏈接
創建軟鏈接: ln -s [源文件或目錄] [目標文件或目錄] 例子: #生成軟鏈接,如果需要創建root權限,加上sudo sudo ln -s libcudnn.so.7 libcudnn.so 注意: 1、創建完了可以在目標文
原创 【目標檢測】COCO數據集下載鏈接
一、下載鏈接 [1] - train2014 images: (13GB) http://images.cocodataset.org/zips/train2014.zip [2] - val2014 images:(6GB) http:
原创 【目標檢測】YOLO系列檢測算法
IoU(Intersection-over-Union)指標 IoU 簡稱交併比,顧名思義數學中交集與並集的比例。假設有兩個集合 A 與 B, IoU 即等於 A 與 B 的交集除以 A 與 B 的並集,表達式如下: 在目標檢測中,Io
原创 【Error】python中出現ValueError: invalid literal for int() with base 10: '262.419157788'
出現該錯誤主要時再將字符串轉換爲int類型時,是由於string類型變量轉換爲int時出現異常,這裏顯示的是將字符串'262.419157788'轉換爲int類型出現問題。 解決辦法:再將float的字符串轉換爲int類型時,先將str
原创 【視頻行爲識別8】SlowFast Networks for Video Recognition快慢雙通道網絡(CVPR2019)
背景: 作者通過觀察發現一個問題:視頻場景中的幀通常包含兩個不同的部分 —> 不怎麼變化或者緩慢變化的靜態區域和正在發生變化的動態區域(此區域一般爲視頻中行爲發生的重要處)。例如,飛機起飛的視頻會包含相對靜態的機場和一個
原创 【視頻行爲識別3】C3D:使用3D卷積網絡學習時空特徵(2015)
3D卷積和池化 觀點: 1)只有3D卷積才能保留輸入信號的時間信息,相同的現象適用於2D和3D池化. 2)雖然以前一些時間流網絡採用多個幀作爲輸入,但是由於2D卷積,在第一卷積層之後,時間信息完全消失了。 2D與3D卷積之間的區別: