原创 11、什麼是熵

從名字上來看,熵給人一種很玄乎,不知道是啥的感覺。其實,熵的定義很簡單,即用來表示隨機變量的不確定性。之所以給人玄乎的感覺,大概是因爲爲何要取這樣的名字,以及怎麼用。     熵的概念最早起源於物理學,用於度量一個熱力學系統的無序程度。在

原创 C++爬蟲爬取網頁圖像

最近學深度學習,但是無奈很缺數據,所以就寫了一個網頁爬蟲去爬取圖像,(一個一個手動下載的話太煩了) #define _SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS #define _WINSOCK_D

原创 多功能的small_vmt_hook

在github上面發現一個漂亮的hook,特此記錄一下 /* This file is part of nSkinz by namazso, licensed under the MIT license: * * MIT License

原创 9、overfitting怎麼解決

overfitting就是過擬合, 其直觀的表現如下圖所示,隨着訓練過程的進行,模型複雜度增加,在training data上的error漸漸減小,但是在驗證集上的error卻反而漸漸增大——因爲訓練出來的網絡過擬合了訓練集, 對訓練集外

原创 7、邏輯斯特迴歸爲什麼要對特徵進行離散化。

① 非線性!非線性!非線性!邏輯迴歸屬於廣義線性模型,表達能力受限;單變量離散化爲N個後,每個變量有單獨的權重,相當於爲模型引入了非線性,能夠提升模型表達能力,加大擬合; 離散特徵的增加和減少都很容易,易於模型的快速迭代;   ② 速度快