原创 Python實現K-Means聚類算法

一、算法簡介 1、K-Means算法是硬聚類算法,是典型的基於原型的目標函數聚類方法的代表,它是數據點到原型的某種距離作爲優化的目標函數,利用函數求極值的方法得到迭代運算的調整規則。 2、K-Means算法以歐式距離作爲相似度測度,它是求

原创 Python3爬蟲小程序——爬取各類天氣信息(2)

【靜態頁面信息的爬取】 更新:有關代碼已上傳到我的GitHub上,點擊打開鏈接 根據前面做的那個爬蟲,進行了一些修改,例如對headers信息的僞裝。通過利用Fiddler抓包軟件,抓到headers信息,然後構造我們的頭信息進行爬蟲設計

原创 ASP.NET無法使用sa用戶登錄數據庫原因及解決方案

【問題描述】 工程中web.config中寫了用sa用戶登錄數據庫。但是無法使用sa用戶中的數據庫。出現如下提示錯誤信息:   【錯誤原因】 (1)可能因爲數據庫中sa用戶尚未啓用。 (2)未知原因不能使用sa用戶來操作數據庫。 (3)

原创 Java Web開發中使用Mysql數據庫

開發模式使用的是JSP+Servlet+JavaBean開發模式 第一步 裝好數據庫。並在數據庫中建好需要使用的數據庫以及表。 第二步 將數據庫連接jar包導入到工程文件中。Eclipse是導入到WebContent/WEB-INF/l

原创 Python3爬蟲小程序——爬取各類天氣信息(3)

經過前面靜態頁面的爬取已經收集到很多信息了。最近在看怎麼從動態頁面上爬取信息,主要用到的還是selenium+phantomJS工具(如何安裝?點擊這裏查看),雖然存在一些缺點(效率不是很高),但是還算不錯。 於是乎,前面從天氣網(htt

原创 如何生成大批量的可以訓練的數據

深度學習中,讓一個模型能夠有更好的泛化能力,最重要的根本就是數據的多樣性。但是現實中場景數據複雜多樣。以OCR文檔識別爲例,一方面收集會耗費大量精力(文檔圖像拍照等等),另一方面,標註過程費時費力,不僅需要標註文本位置,還需要標註其對應的

原创 上採樣、上池化、雙線性插值、反捲積梳理

在深度學習的網絡模型中,不但有通過卷積獲得圖像特徵,而且也有一些放大操作,例如FCN、U-Net等等。這些操作有上採樣(Upsampling)、上池化(Unpooling)、雙線性插值、反捲積。下面對這四個進行梳理。   一、上採樣(Up

原创 RuntimeError: CUDA error: an illegal memory access was encountered

CRNN訓練出現了RuntimeError: CUDA error: an illegal memory access was encountered錯誤。 使用的PyTorch 1.1,自帶CTCLoss函數。 查閱資料,發現既不是字典

原创 Python-OpenCV之圖像與位置標註的仿射變換

不管是在目標檢測還是在OCR文本檢測的時候,都會有數據預處理這一步。那我們在對圖像進行縮放、旋轉的過程中,標註的位置信息肯定也是會變化的。 1  縮放 圖像利用OpenCV進行縮放,我們可以使用resize方法進行。但是標註信息呢?以按照

原创 OCR目前的發展現狀綜述

本文目的是爲了總結OCR各類技術的發展,從蒐集資料到整理,可以看出OCR技術目前的一個大致發展趨勢。目前還處於隨時添加狀態,敬請期待! 【更新時間】2019年6月14日   1  OCR的應用場景 目前OCR的應用場景主要分爲以下三個方面

原创 【轉載】從編程實現角度學習Faster R-CNN(附極簡實現)

【原文地址】https://zhuanlan.zhihu.com/p/32404424 【GitHub極簡實現】https://github.com/chenyuntc/simple-faster-rcnn-pytorch   1  概述

原创 【論文筆記】端到端文本檢測與識別——FOTS

常見的深度學習OCR過程中,會把文本檢測與文本識別拆分成兩個部分,通過先檢測後識別的方法對圖片中的文本進行OCR識別。在商湯的paper中,一種新的端到端快速檢測識別模型給了我們一個很大的驚喜。   【論文題目】FOTS: Fast Or

原创 遇見你,是我幸福的開始

2016年9月,在完成了本科四年的學習之後,我又一次坐上了前往北京的列車,踏上了碩士學習深造之旅。 在這裏,第一次遇到了你,在我心裏,你是一個陽光開朗、積極向上、可愛漂亮的女生。研一的生活,是學習與活動一起進行的一年。在這一年,我們共同完

原创 使用深度學習去除摩爾紋干擾(論文筆記)

針對之前數據採集過程中摩爾紋的嚴重干擾,導致OCR對這種圖片檢測與識別精度不高的問題,搜索了大量有關如何消除摩爾紋的資料,包括傳統的圖像處理方法以及深度學習方法,發現這篇論文無論從方法上還是效果上都挺不錯的。   【論文題目】Moiré

原创 文本檢測之EAST

【原文地址】https://zhuanlan.zhihu.com/p/37504120 簡介 論文題目:EAST: An Efficient and Accurate Scene Text Detector 論文地址:https://ar