原创 【字符分割】PSENet原理和代碼淺讀之原理

目錄 1.Overall Pipeline 2.Network Design 3.Progressive Scale Expansion Algorithm 4.Label Generation 5.Loss Function PSENe

原创 No module named 'warpctc_pytorch'

1. Traceback (most recent call last): File "/home/###/Downloads/softmare/pycharm-community-2018.3.2/helpers/pydev/py

原创 pytorch的各種loss

總計學習一下pytorch的各種loss函數: 轉載自:https://zhuanlan.zhihu.com/p/61379965 目錄 1.L1 loss 2.MSE Loss 3.CrossEntropy Loss 4.NLL Los

原创 PSENet訓練

目錄 1.數據標註問題 2.數據中圖片和標籤的命名格式 3.作者的測試代碼 訓練工程源自:https://github.com/WenmuZhou/PSENet.pytorch 1.數據標註問題 標註多邊形的的頂點,使用順時針標註,四邊形

原创 圖像的白化處理

目錄 1.白化處理的作用 2.白化處理的原理 3.白化處理的代碼 1.白化處理的作用 圖像白化(whitening)可用於對過度曝光或低曝光的圖片進行處理,下圖所示,左圖是過分曝光,右圖是白化後的結果;    2.白化處理的原理 處理的方

原创 deepin上使用gitkraken

目錄   1.本機gitkraken的卸載 2.使用命名行安裝gitkraken 2.安裝gitkraken的包 遇到問題1:Push Faild:mastr Push Failed on refs/heads/master:pre-re

原创 【ocr文字檢測】Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network

最近要更新文本檢測的訓練模型,所以看了PSE的升級版PAN; 論文:https://arxiv.org/abs/1908.05900v1 代碼:https://github.com/WenmuZhou/PAN.pytorch 目錄 1.該

原创 PSENet原理和代碼淺讀之代碼

目錄 1.數據增強 2.生成segment mask 3.loss計算 PSE代碼分析,實現模型性能優化; 1.數據增強 對文本樣本數據進行數據增強: def augmentation(im: np.ndarray, text_poly

原创 PSENet原理和代碼淺讀之原理

目錄 1.Overall Pipeline 2.Network Design 3.Progressive Scale Expansion Algorithm 4.Label Generation 5.Loss Function PSENe

原创 ocr小白理解Aster算法---------什麼是sequence2sequence

目錄   什麼是seq2seq 第一種seq2seq 第二種seq2seq beam-search算法 參考文獻 什麼是seq2seq seq2seq 模型就像一個翻譯模型,輸入是一個序列(比如一個英文句子),輸出也是一個序列(比如該英文

原创 ocr小白入門CRNN

什麼是CRNN CRNN的整體框架圖: CRNN=CNN+RNN+CTC 1)CNN主要是爲RNN提取特徵; 2)RNN主要是將CNN輸出的特徵序列轉換爲輸出; 3)CTC爲翻譯層,得到最終的預測結果,由於CTC適合不知道輸入和輸出是否

原创 【ocr:end to end】ASTER :An Attentional Scene Text Recognizer with Flexible Rectification

最近從目標檢測和分類轉到了做OCR,什麼都不太懂,只能一點一點的去理解: 文中需要學習的知識點: Sequence to Sequence Learning with Neural Networks sequence to sequenc

原创 vott使用

目錄 1.安裝snap 2.下載安裝vott 3.vott運行 護照字符的參考信息 最近在標註實例分割的數據,使用vott的工具,將vott學習使用過程記錄下: 1.安裝snap 因爲vott需要使用snap安裝,所以瞭解一下snap:

原创 Gitlab中lfs的使用

參考鏈接: 跨平臺最好用的Git GUI工具gitkraken Learning Git: What is Git LFS?

原创 字符識別——PSENet

最近在進行護照的字符識別,然後屬ocr項目的小白,入手的網絡結構PSENet: 以下總結了一些好心人的貢獻: OCR之PSE檢測算法代碼詳解 CV-Paper-文字檢測-Shape Robust Text Detection PSENet