原创 將原圖片切割成九宮格圖片

本文想實現一個分類器模型,該模型能夠識別出九宮格圖片並將圖片進行切割,首先我要構造訓練集,也就是自己生成一些九宮格圖片。 其中r=3表示將其切割爲3行,c=3表示將其切割爲3列。你也可以生成4宮格圖片。 import cv2 impor

原创 面試問題記錄

1 xgboost的介紹 2 lightgbm和xgboost的區別 3 決策樹介紹 信息增益 信息熵介紹 4 roc曲線的計算 5 分類器閾值的確定方法 6 京東項目樣本劃分方法的缺點:導致數據缺失 7 邏輯迴歸的介紹 8 邏輯迴歸的實

原创 For interview:京東

                                                                            京東項目    數據來源:京東JDATA算法大賽:如期而至-用戶購買時間預測  數據描

原创 小目標檢測論文閱讀

  算法發展歷程: 傳統圖像算法: 傳統圖像算法使用hand-made feature,常用方法有SIFT、HOG、圖像金字塔等。對於小目標的檢測,傳統圖像算法有人工複雜度高,模型泛化性差等缺點,因此逐漸被深度學習模型取代。 深度學習:

原创 For interview:電池項目

項目目的:針對有缺陷電池圖片,確定缺陷的位置和類別,進行電池質量檢測。 缺陷類別:劃痕、凹點、褶皺 圖片大小:3800(高)*2800(寬) 30M左右每張 數據集大小:1400張左右的圖片 每一類缺陷的數量? 數據指標: (1)map

原创 For interview:長電項目

圖片切割思路:每張電子元件圖片都提供相應的輔助定位圖片,每張圖片中芯片放置的背景和位置都不同,輔助定位圖中的金屬部分是過度曝光的,但每張圖的曝光強度不同,利用這個條件,我們對圖片進行了預處理(如底帽變換:消除光照不均勻、膨脹:) 將預處理

原创 CRNN論文閱讀佔坑

CRNN:目前常用的字符識別模型 但在實踐過程中發現 該模型無論在訓練還是測試上效果都不夠優秀 說明OCR領域還有許多需要研究的地方 CRNN模型也有許多可改進之處 簡單來說,模型的結構就是一個卷積網絡+雙向lstm+全連接層進行分類+c

原创 項目思路記錄

1 目標切割假設:沒有目標模板(不能運用模板匹配)要求:精確切割出目標思路:傳統圖像處理技術(因爲神經網絡或級聯分類器不能精確切割)處理思想:畫出像素分佈圖,觀察分佈,確定特徵具體步驟:(1)閾值處理閾值處理的方法這裏選擇了取圖像85%的

原创 ctpn、east閱讀要點記錄

最近要做一些ocr的事情,閱讀了文字定位的相關論文,主要是ctpn和east.下面對這兩篇論文的藥店進行一個記錄。 CTPN ctpn結合了卷積神經網絡和循環神經網絡。卷機神經網絡用於提取圖片特徵,循環神經網絡能夠幫助提升對文字的定位和分

原创 docker的簡單介紹

Docker鏡像 簡單來說,Docker鏡像是一個配置好了所需環境的操作系統,我們在自己的電腦上運行一個docker容器,相當於開啓了一個新的操作系統。比如說,如果我們在一臺windows系統的電腦上運行一個安裝了ubuntu系統的doc

原创 uaitrain操作平臺記錄

emm居然有人看 建議如果對ucloud人工智能平臺感興趣的話,可以查看ucloud文檔 裏面的內容是經過認真審覈的。 這個是我瞎寫的 裏面的錯誤以後有時間我修改一下....   如果我們想要自己製作鏡像 1 操作環境準備    (1)安

原创 FPN特徵金字塔網絡--論文解讀

     這篇文章我認爲算是對用卷積神經網絡進行目標檢測方法的一種改進,通過提取多尺度的特徵信息進行融合,進而提高目標檢測的精度,特別是在小物體檢測上的精度。     文章的思想比較簡單,主要是利用特徵金字塔對不同層次的特徵進行尺度變化後