原创 模型量化技術(入門級理解,不涉及複雜公式和深入的原理)
量化技術 量化的概念 一般是高精度浮點數表示的網絡權值以及激活值用低精度(例如8比特定點)來近似表示 達到模型輕量化,加速深度學習模型推理,目前8比特推理已經比較成熟 使用低精度的模型推理的優點: ①模型存儲主要是每個層的權值,量化後模型佔
原创 PAN論文閱讀筆記
Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network PAN是一個任意形狀文字檢測模型,稱之爲像素聚合網絡(PAN)。是p
原创 east論文閱讀筆記
EAST( Efficient and Accurate Scene Text Detector) 簡潔的pipline FCN+nms 前面的特徵提取以及深淺層融合較容易理解,類unet結構 網絡輸出一個score map 和
原创 PSENET閱讀筆記
Shape Robust Text Detection with Progressive Scale Expansion Network PSENET全稱叫做漸進式擴展網絡,是一種由縮放的文本核逐漸擴展爲真實文本的算法;主要解決的就是距離很
原创 batch-normalization 批標準化
batch-normalization 基本思想與通用框架 反向傳播推導以及BN的好處 normalization的分類 多卡同步BN 後來學者探討BN有用的真正原因,推翻原論文想法
原创 U-net網絡實現醫學圖像分割以及遙感圖像分割源代碼
U-net網絡主要思路是源於FCN,採用全卷積網絡,對圖像進行逐像素分類,能在圖像分割領域達到不錯的效果。 因其網絡結構類似於U型,所以以此命名,可以由其架構清晰的看出,其構成是由左端的卷積壓縮層,以及右端的轉置卷積放大層組成; 左右兩端
原创 leetcode, 子集,組合,排列,回溯法解決對比
子集和組合問題,基本相同,區別在於添加到res時候,子集不需要判斷大小,因爲所有長度都要; 組合需要判斷大小track等於k的時候,才添加到結果 在更新選擇列表的時候,用start來進行數組區間的分隔。 排列問題,與子集組合
原创 cv2.resize(), 改變圖片大小
需注意一點的是,第二個參數是一個元組 img_raw = cv2.imread('test.jpg') size = (400,300) #注意排序是反的,出來順序是300*400 img = cv2.resize(img, s
原创 moblienetv1、moblienetv2、mobilenetv3發展歷程
moblienetv1、moblienetv2、mobilenetv3發展歷程 參考知乎大神R.JD,總結的非常到位:https://zhuanlan.zhihu.com/p/70703846utm_source=wechat_sessio
原创 pyotrch--nn.Conv2d中groups參數的理解
調用形式: self.conv2 = nn.Conv2d(expand_size, expand_size, kernel_size=kernel_size, stride=stride,
原创 文本檢測數據集以及標籤形式說明
文本檢測數據集以及標籤形式說明 icdar15系列,帶角度的四邊形標籤 打開標籤文件,每行爲一個文本框座標以及語言類型,文字,###代表模糊不清 形式,是四邊形的四個點的座標。 ctw1500系列任意形狀的數據集標籤
原创 Ubuntu16.04深度學習基本環境搭建,tensorflow , keras , pytorch , cuda
Ubuntu16.04深度學習基本環境搭建,tensorflow , keras , pytorch , cuda Ubuntu16.04安裝 參考https://blog.csdn.net/flyyufenfei/article/deta