原创 OpenCV Using Python——基於SURF特徵提取和金字塔LK光流法的單目視覺三維重建

基於SURF特徵提取和金字塔LK光流法的單目視覺三維重建 1. 單目視覺三維重建問題         在前面的文章中,筆者用SIFT提取特徵後用radio測試剔除了匹配中異常的特徵點,然後根據匹配合格的特徵點計算基礎矩陣和本徵矩陣,對本徵

原创 OpenCV Using Python——單目視覺三維重建

單目視覺三維重建 1. 單目視覺三維重建簡介         單目視覺三維重建是根據單個攝像頭的運動模擬雙目視覺獲得物體在空間中的三維視覺信息。已知單個攝像頭在兩個不同時間點上同時在空間中兩個不同位置的圖像等價於已知兩個攝像頭同一時間在空

原创 OpenCV Using Python——調整基於HAAR特徵的AdaBoost級聯分類器的物體識別的參數

調整基於HAAR特徵的AdaBoost級聯分類器的物體識別的參數 1. 基於HAAR特徵的AdaBoost級聯分類器的物體識別問題         Paul A. Viola和Michael J. Jones在2001年發表文章“使用簡單

原创 Theano入門——CIFAR-10和CIFAR-100數據集

Theano入門——CIFAR-10和CIFAR-100數據集 1.CIFAR-10數據集介紹 CIFAR-10數據集包含60000個32*32的彩色圖像,共有10類。有50000個訓練圖像和10000個測試圖像。 數據集分爲5個訓練塊和

原创 用於視覺識別的卷積神經網絡

用於視覺識別的卷積神經網絡 一.卷積神經網絡(CNNs/ConvNets) 1.架構概述 a.1個卷積網絡架構是一系列將圖像體積轉換成輸出體積的層組成; b.層有不同的類型(CONV/FC/RELU/POOL是目前最受歡迎的); c.每層

原创 Torch學習——開始

Torch學習——開始 1. 深度學習框架 到目前爲止出現了各種各樣的深度學習的解決方案框架,其中包括Caffe,CUDA convnet,Pylearn2,Theano,Torch以及TensorFlow等。Caffe和CUDA co

原创 Arduino Mega 2560與Arduino Uno R3——nRF24L01通信

nRF24L01通信 1. nRF24L01通信簡介 (1)nRF24L01通信經歷        先說說小菜鳥蛋疼調試模塊的經歷吧~有可能某些人覺得沒有必要寫這篇文章,因爲Arduino作爲開源硬件,本身容易上手例程也很多,直接跑就可以

原创 OpenCV Using Python——構造方向可控金字塔

構造方向可控金字塔 1. 方向可控金字塔簡介        Willian T. Freeman等1991年提出方向可控金字塔。和高斯金字塔或拉普拉斯金字塔相比,方向金字塔除了分解尺度子帶以外,還會分解方向子帶。爲什麼需要用方向子帶呢?因

原创 Theano入門——卷積神經網絡

Theano入門——卷積神經網絡 1.卷積神經網絡介紹 參考鏈接[1]和[3]。 2.Theano實現 (1)conv2d函數 2D卷積。(2)dimshuffle(*pattern)函數 置換維度的序列。pattern的舉例如下: (

原创 Theano入門——MNIST數據庫

Theano入門——MNIST數據庫 MNIST手寫數字數據庫包含60000個訓練樣本,10000個測試樣本,它是更大數據集NIST的子集。數字大小已經歸一化並居中於固定大小圖像中。 1. MNIST數據庫的文件格式 文件中的所有整數以

原创 Unity 3D——虛擬場景中的飛行攝像頭

虛擬場景中的飛行攝像頭 1. 虛擬場景中的飛行攝像頭簡介         虛擬場景中的飛行攝像頭是指在場景中運動的第一視角(嗯,應該好像大概是這個意思- -||)。這裏我想說的重點內容不是如何去構建虛擬場景,而是如何讓視角在場景中飛翔的思

原创 Galaxy Zoo Challenge解決方案小結

Galaxy Zoo Challenge解決方案小結 1.過擬合 如果不過擬合,說明你的網絡不夠大。模型過擬合問題緩和: (1)數據增廣 (2)Dropout和權重歸一化約束 (3)修改網絡架構來增加參數共享 2.預處理和數據增廣

原创 立體視覺——固定窗口的視差圖計算

立體視覺——固定窗口的視差圖計算 1. 視差圖計算[1] 深度信息可以通過計算1幅圖像和其它圖像的特徵位置的像素差獲得。視差圖和深度圖很像,因爲視差大的像素離攝像機近,而視差小的像素離攝像機遠。按以米爲單位來計算攝像機距物體多遠需要額

原创 Theano入門——Logistic迴歸

Theano入門——Logistic迴歸 1.Logistic迴歸介紹 參考鏈接(1)。 2.參數設置 (1)輸入權重w 輸入權重矩陣的維度需要設置,行圖像的大小,列爲標籤one-hot編碼後的大小,cifar-10共有10類,所以爲

原创 Caffe學習——Imagenet分類

Caffe學習——Imagenet分類 1. Caffe安裝 參考Alten Li的Caffe安裝[1]。 2. Imagenet分類 代碼來自Caffe的Notebook Examples[2]。在導入Caffe前,先在sys.pat