原创 模型構建問題

圖像預處理:減去的均值是數據集所有圖片的RGB三個通道的均值構成的向量[Rmean, Gmean, Bmean],每個通道各一個均值。然後所有圖像都減去此向量。 MEAN_VALUE = np.array([103.939, 1

原创 堆砌相同高度的塔

題目 小易有n塊磚塊,每一塊磚塊有一個高度。小易希望利用這些磚塊堆砌兩座相同高度的塔。爲了讓問題簡單,磚塊堆砌就是簡單的高度相加,某一塊磚只能使用在一座塔中一次。小易現在讓能夠堆砌出來的兩座塔的高度儘量高,小易能否完成呢。 輸入

原创 高性能Numpy/Scipy:使用Intel MKL和Intel Compilers

1.獲取Intel Parallel Studio XE Intel免費軟件工具提供免費的軟件包,其中包括完整的Intel編譯器和計算庫及其激活碼,軟件和激活碼一一對應。注意需要使用教育郵箱註冊,否則不予通過。 2. 安裝過程 解

原创 Very deep convolutional networks for larage-scale image recognition

1. 結構配置 預處理只有減去所有RGB像素的均值 使用最小的感受野3× 3,如果選擇1× 1,則可作爲輸入通道的線性變換(後面跟着激活函數的非線性)。 卷積stride 1,pad 1(卷積圖大小不會因爲卷積而改變) 共5個最

原创 概率論重點

1. 古典概型 樣本空間有限個基本事件,基本事件等可能發生 P(A)=A包含基本事件數S所有基本事件數P(A)=\frac{A包含基本事件數}{S所有基本事件數}P(A)=S所有基本事件數A包含基本事件數​ 2. 條件概率 A發生

原创 分類問題中的交叉熵損失和均方損失

分類問題的損失函數 交叉熵損失(Cross Entropy Loss):假設誤差是二值分佈,可以視爲預測概率分佈和真實概率分佈的相似程度。在分類問題中有良好的應用 CE(θ)=−∑i=1nyi∗log(y^i) 其中yi 表

原创 Network In Network

1. CNN CNN中的濾波器是一種廣義的線性模型(GLM),它的抽象水平較低,而抽象可以使特徵具有不變性。要讓GLM有好的抽象,樣本中隱含的概念必須是線性可分的。因此一般的CNN默認的先驗是樣本中隱含概念是線性可分的,而實際情

原创 Git常用操作

1. 安裝與配置 Linux系統 $ sudo apt-get install git Windows系統 從官網下載[https://git-for-windows.github.io/][1], 用Git bash操作。 配

原创 OverFeat Integrated Recognition, Localization and Detection using Convolutional Networks

1. 分類 固定輸入最短邊大小爲256(訓練使用多尺度縮放) 提取5個隨機剪裁和水平翻轉的231× 231圖片 batchSize 128 權重初始化均值0,標準差0.01的均勻分佈, momentum 0.6 懲罰係數1e-5

原创 Going deeper with convolutions

1. 動機 提高深度網絡的性能可以通過加深網絡的深度和寬度,但是缺點是容易過擬合且計算量大。所以應該採用稀疏連接結構代替全連接結構,但是現有設備對稀疏計算並不高效,所以依然只採用稠密計算。Inception是一種逼近稀疏連接的結構

原创 Maxout Networks

1. Dropout dropout可以訓練集成模型,它們共享參數並近似的對這些模型的預測進行了平均。它可以被當作一種通用的方法用在任何一種MLP和CNN模型中,但是在論文中,由於dropout的模型平均過程沒有被證明,因而一個

原创 ImageNet Classification with Deep Convolutional Neural Networks

1. 數據集ImageNet 數據特徵:15 million張,22000類,分辨率高且多樣 預處理:降採樣到256× 256固定分辨率,對矩形邊框的圖像,先讓短邊縮小到256,然後剪裁出中心的256× 256的部分。使用中心化

原创 矩陣快速冪求斐波那契數列

快速冪 求數a 的n 次冪,可以採用二分法進行快速計算,即 an={an2⋅an2,a⋅an2⋅an2,n爲偶數n爲奇數 public int power(int a, int n){ int result = 1;

原创 動態規劃求最長迴文子序列

題目 找出字符串中最長迴文子序列,可以在原字符串中不連續。 如“character”的最長迴文子序列爲“carac”。 分析1 設字符串s 從第i 個字符到第j 個字符的最長迴文子序列長度爲p[i,j] ,則遞歸式爲 p[i,j

原创 地理空間索引:線段的GeoHash編碼優化

在上一篇博客中,我們探討了關於打網格尋找線段和多邊形的GeoHash編碼的框架,但是對直線而言還有更高效的編碼算法,本文就探討線段的GeoHash編碼優化。 1. 線段的GeoHash編碼問題 打網格的GeoHash編碼方式需要在2維