原创 【深度學習筆記整理-5.4】卷積神經網絡可視化

我們知道,CNN由通道channel以及與通道相連的filter組成,我們可以可視化的內容就有這二者, 其一,是卷積神經網絡的中間輸出,幫助我們瞭解層是如何對輸入進行變換的。 其二,是卷積神經網絡的過濾器,幫助我們精確理解卷積神經網絡中每

原创 【深度學習筆記整理-4.1】如何避免過擬合?

     其實神經網絡訓練的過程就是一個欠擬合與過擬合拉鋸的過程,一方面,我們希望我們的網絡可以比較好的擬合訓練數據,另一方面,我們又不希望它學習的那麼好,以至於最終只是記憶住了全部答案。     解決過擬合的問題非常重要,一般有如下四種

原创 【深度學習筆記整理-5.1】CNN:卷積神經網絡

CNN:卷積神經網絡 卷積 卷積神經網絡和其名字有較大的聯繫,這裏的卷積即有‘滑動乘積’的意思,不同於前面對圖片向量的扁平化處理,CNN會更加在意局部像素的相關性,這些局部像素可能在拉直向量後被分的很遠,以至於失去了其原有的相關性。 “卷

原创 【深度學習筆記整理-3.2】Keras多分類: 路透社新聞主題

1.關於多分類,如果是每個數據點只能被劃分到一個類別,那他就是單標籤,多分類問題,反之,如果每個數據點可以被分到多個類別,那他就是一個多標籤,多分類的問題。關於新聞主題分類,就是典型的單標籤,多分類問題。 2.路透社數據集也是keras內

原创 【深度學習筆記整理-3.3】標準化與K折交叉驗證

1.標準化 首先標準化可以解決不同範圍數據的情況,解決其中一種特徵受制於scale而導致的弱影響問題。 此時不同特徵同屬於接近的scale,梯度下降的速度是最快的。 代碼如下: mean = train_data.mean(axis=

原创 Python:5分鐘理解裝飾器的本質

  1.裝飾器的應用場景    當我們想對某函數賦予額外功能,特別是當許多函數都需要這個功能時(如對某函數的執行時間計時),首先我們不可能對函數一個一個的加代碼,那樣太耗時,其次我們又不想破壞原來函數本身的代碼整潔度(比如計時就不算原來函

原创 【深度學習筆記整理-3.1】Keras二分類:IMDB影評

1.IMDB數據集: IMDB數據集是keras內置的數據集之一,共有50000條嚴重兩級分化的評論,其中訓練集和測試集都有25000條,且二者的正負評論各佔50%(數據極爲平衡,真實數據可能不會如此,對於類別不平衡數據需要進行一定處理)

原创 【深度學習筆記整理-2.3】axis,transpose,reshape

1.axis axis一直是個讓人混淆的點,axis=k代表了沿着某軸,可是這個軸代表了什麼意思?瞭解過上一節筆記之後,其實這塊理解起來就比較簡單了。 簡單複習一下,對於一個高維的張量(a,b,c,d),我們可以從後向前看,首先是有個b*

原创 【深度學習筆記整理-2.1】深度學習的Hello World---MNIST手寫識別

1.MNIST是keras中一個關於手寫識別的數據集,其中有6萬張訓練圖像與1萬張測試圖像。 keras中共有七個內置數據集, 注:CIFAR10與CIFAR100分別爲分類數爲10和分類數100的兩個圖片數據集。 【除內置數據庫外,U

原创 【深度學習筆記整理-1.2】概率模型和貝葉斯定理

概率模型: 1.1各種概率及其定義: ①聯合概率: 表示包含多個條件且所有條件同時成立的概率。 在機器學習中,這些所謂的條件其實就是數據的各種特徵, 比如一個人身高=180,同時體重=180([180,180])的概率P(身高

原创 【深度學習筆記整理-1.2.3】梯度下降:

1.梯度常用符號說明 ①我們常將參數上標視爲某時間點,例如參數代表第0個時間點的參數,即初始參數。 ②無論在哪個時間點,我們的參數都是成千上萬個的,通常用下標來區分他們,例如 ,其中向量的某一元素代表了該時刻的第i個參數。 ③我們常用倒三

原创 【深度學習筆記整理-1.2.2】支持向量機

1.支持向量機的目的: 獲取一個分類邊界,這個邊界可以最大化距離不同類別的最近點。 這樣的邊界可以擁有更好的抗噪聲干擾性。 2.限制: ①分類正確 ②margin=min類別到邊界距離 於是,我們將這個問題轉化爲了一個maxmin

原创 【深度學習筆記整理-1.1】深度學習簡介

1.人工智能定義: 努力將通常由人類完成的智力任務自動化。 根據定義來看,人工智能是一個比較綜合的領域,不僅包括機器學習和深度學習,也包括了一些不涉及學習的方法,比如早期使用足夠多的硬編碼規則(就是if else這類)來模擬人工,被稱爲符

原创 關於pandas和numpy對於txt&csv格式文件的處理

     最近需要對數據庫進行矩陣化處理,一開始不知道pandas和numpy這兩個包的存在,愣是使用的readlines讀取然後自己各種轉換,最後浪費了很多的時間,上網查了半天也沒找到有用的信息,最後還是翻的官方document解決問題

原创 2019年吉大967軟件初試真題回憶版

簡答題 1.根據中綴表達式寫後綴表達式(基礎題,可根據表達式對應的樹寫出或驗證) 2.寫出快速排序過程(注意吉大的快排與王道的過程不同) 3.二分查找確定比較次數和比較過程 4.說明prim算法是如何求城市間通行的最小花費的(這問比較容易