原创 2-D CTC Loss

2D-CTC for Scene Text Recognition,1-D CTC Loss參考CTC Loss和Focal CTC Loss Motivation 普通的CTC僅支持1-d,但是文字識別不像語音識別,很多時候

原创 頭條面試題-統計有序數組裏平方和的數目

#include <iostream> using namespace std; int get_square_n(int*a, int i, int j){ int cnt = 0; while(i < j){

原创 CTC Loss

最近一直在做手寫體識別的工作,其中有個很重要的loss那就是ctc loss,之前在文檔識別與分析課程中學習過,但是時間久遠,早已忘得一乾二淨,現在重新整理記錄下 本文大量引用了- CTC Algorithm Explaine

原创 最大連通域

#include <iostream> using namespace std; int max_area=0; void dfs(int a[][10], int i, int j, int h, int w, int flag

原创 c++靜態庫鏈接順序引發的bug

最近做個OpenCV的項目,搞了半個月一直解決不了,最後發現是靜態庫鏈接順序的問題 問題描述以及解決辦法 最近用emsdk將c/c++轉到wasm,用到emsdk裏面./emcc來編譯c/c++,注意emsdk自帶的clang

原创 graphcut/banded graphcut/grabcut解讀

最近手頭有個項目需要加速graph cut,這裏就參考一篇論文banded graph cut: A Multilevel Banded Graph Cuts Method for Fast Image Segmentation

原创 int8量化和tvm實現

量化主要有兩種方案 直接訓練量化模型如Deepcompression,Binary-Net,Tenary-Net,Dorefa-Net 對訓練好的float模型(以float32爲例)直接進行量化(以int8爲例),這邊博客主

原创 貪心、遞歸和動態規劃

貪心 每個階段的最優狀態都是由上一個階段的最優狀態得到的(最優子結構)而不管上一狀態是如何得到的(無後效性) 分治策略(遞歸) 將原問題分解爲若干個規模較小但類似於原問題的子問題(Divide),「遞歸」的求解這些子問題(Conqu

原创 對象切片(object slicing)和多態

在函數傳參處理多態性時,如果一個派生類對象在UpCasting時,用的是傳值的方式,而不是指針和引用,那麼,這個派生類對象在UpCasting以後,將會被slice成基類對象。https://www.zhihu.com/questi

原创 c++隱藏

今天才知道c++繼承裏面的隱藏特性,真是孤陋寡聞了。 #include <iostream> using namespace std; class A { public: void print() {cout<<"A

原创 anchor free系列檢測方法

one stage和two stage是目標檢測的主流方法,最近由deng老闆引領的anchor free方法另闢蹊徑,以關鍵點檢測爲基礎來做檢測,也算是one stage的一種吧 CornerNet ]預測圖片上所有物體的左上角

原创 TridentNet解讀

檢測領域一直存在一個scale variation問題,大小物體對視野域的需要是不一樣的,deformable cnn的作者daijifeng老師就提到一個說法:最好的視野域就是剛好“覆蓋自己”,不要太大也不要太小。前人有3種途徑

原创 Mobilenet v1/2和Shufflenet v1/v2

好久沒寫深度學習方面的文章了,偷閒再寫一篇 衡量指標 FLOPS:floating point operations per second,每秒浮點運算次數,理解爲計算速度。是一個衡量硬件性能的指標。 FLOPs:floatin

原创 LeetCode4:兩個排序數組的中位數

問題 /* * @lc app=leetcode.cn id=4 lang=cpp * * [4] 尋找兩個有序數組的中位數 * * https://leetcode-cn.com/problems/median-of-tw

原创 LeetCode11-盛最多水的容器

/* * @lc app=leetcode.cn id=11 lang=cpp * * [11] 盛最多水的容器 * * https://leetcode-cn.com/problems/container-with-mos