原创 邏輯迴歸 vs 決策樹 vs 支持向量機

邏輯迴歸 邏輯迴歸非常便利並且很有用的一點就是,它輸出的結果並不是一個離散值或者確切的類別。相反,你得到的是一個與每個觀測樣本相關的概率列表。你可以使用不同的標準和常用的性能指標來分析這個概率分數,並得到一個閾值,然後使用最符合你業務問題

原创 常見的幾種最優化方法(梯度下降法、牛頓法、共軛梯度法)

  對批量梯度下降法和隨機梯度下降法的總結: 批量梯度下降---最小化所有訓練樣本的損失函數,使得最終求解的是全局的最優解,即求解的參數是使得風險函數最小,但是對於大規模樣本問題效率低下。 隨機梯度下降---最小化每條樣本的損失函數,雖然

原创 機器學習中的迴歸(Regression)與分類(classification)問題

原文地址:https://blog.csdn.net/wspba/article/details/61927105 分類模型和迴歸模型本質一樣,分類模型是將回歸模型的輸出離散化。 1、Logistic Regression 和 Linea

原创 稀疏編碼筆記

1、稀疏編碼概述 稀疏編碼的概念來自於神經生物學。生物學家提出,哺乳動物在長期的進化中,生成了能夠快速,準確,低代價地表示自然圖像的視覺神經方面的能力,我們直觀地可以想象,我們的眼睛每看到的一副畫面都是上億像素的,而每一幅圖像我們都只用很

原创 深度學習中的卷積與反捲積

編碼器與解碼器 神經網絡本質上就是一個線性變換,通過將輸入的多維向量與權重矩陣相乘,得到一個新的多維向量。 當輸入向量的維度高於輸出向量的維度是,神經網絡就相當於一個編碼器,實現了對高維向量的低維特徵提取.. 當輸入向量維度低於輸出向量維

原创 Bagging和Boosting概念及區別

 原文出處:http://www.cnblogs.com/liuwu265/p/4690486.html Bagging和Boosting都是將已有的分類或迴歸算法通過一定方式組合起來,形成一個性能更加強大的分類器,更準確的說這是一種分類

原创 Python列表、Numpy數組與矩陣的區別

轉載出處:https://blog.csdn.net/wyl1813240346/article/details/79806207 Python列表和Numpy數組的區別:  Numpy使用ndarray對象來處理多維數組,該對象是一個快

原创 python多線程和多進程總結

 python多線程: 多線程的理解:多進程和多線程都可以執行多個任務,線程是進程的一部分。線程的特點是線程之間可以共享內存和變量,資源消耗少(不過再Unix環境中,多進程和多線程資源調度消耗差距不明顯,Unix調度較快),缺點是線程之間

原创 西瓜書筆記

第一章 緒論1、根據西瓜的色澤、根蒂、敲聲判斷一個瓜是好還是壞,這個是分類。判斷西瓜的成熟度是0.95、0.37還是其它。這個是迴歸。2、根據訓練數據是否擁有標記信息,學習任務可大致劃分爲兩大類:“監督學習”(supervised lea

原创 深度學習面試題總結

一、CNN爲什麼可以在CV/NLP/Speech等領域都可以使用?1. 卷積是因爲輸入數據的局部相關性;2. 權值共享是因爲輸入數據的局部特徵具有平移不變性,即在不同位置具有共性的局部特徵。這樣,經過多層次

原创 python 列表遞歸求和、計數、求最大元素

轉載:https://blog.csdn.net/li_zhonglei/article/details/75735556利用python的遞歸來執行求和、計數、求最大元素的方法簡直溜到爆,這裏粘貼一下代碼:列表的遞歸求和:def sum

原创 機器學習自測題知識點總結

1、餘弦相似性:把兩個物品得屬性看成向量,那麼這兩個物品得餘弦相似就是這兩個向量夾角得餘弦。餘弦得定義如下:                                                      例題:    甲、乙、

原创 爲什麼在Python裏推薦使用多進程而不是多線程?

轉載鏈接最近在看Python的多線程,經常我們會聽到老手說:“Python下多線程是雞肋,推薦使用多進程!”,但是爲什麼這麼說呢?                要知其然,更要知其所以然。所以有了下面的深入研究:            

原创 Batch Normalizatoin學習筆記

原文地址:https://blog.csdn.net/hjimce/article/details/50866313我們知道再神經網絡訓練之前,都需要對輸入數據做一個歸一化處理,那麼具體爲什麼要歸一化呢?歸一化之後又什麼好處呢?原因在於神

原创 卷積神經網絡的理解

卷積神經網絡較全連接網絡主要特點是局部相關和權值共享。局部相關的理論是對於一幅圖像的一個像素點P來說,離這個像素點P越近的像素點對其影響也就越大。權值共享:根據自然圖像的統計特性,某個區域的權值也可以作用於另一個區域。這裏的全職共享說白了