原创 Logistic Regression 之 Sigmoid

  邏輯迴歸(Logistic Regression, LR)模型是一個二分類模型,屬於廣義線性模型,它還有個名字叫做二項邏輯斯蒂(諦)迴歸(不知爲什麼加個斯蒂(諦)),雖然叫XX迴歸,但卻不屬於迴歸模型。 用

原创 在nlog(n)時間裏對單鏈表排序

兩個思路:    快速排序(邏輯是自頂向下)。先劃分排序(一次確定一個位置),再對左邊右邊分別排序,一直到最小粒度;    歸併排序(邏輯自下而上) 先一直到最小粒度,然後兩兩合併排序,最合合成排序好的鏈表;1,快速排序        1

原创 基於theano的keras安裝

 1)首先如果你裝的是anaconda的話,只需再裝上theano就可以安裝keras啦  2)在命令提示符裏輸入cmd,命令行 pip install keras,一般就ok(網上都這麼說),但我的卻不這樣  (我的配置是win

原创 LateX在windows中運用MiKTeX

 LateX是一個很好的排版系統,是基於Tex,可以生成pdf,你所看到的一些美麗的論文說不定就是用LateX來排版的。  在Windows下使用的是MiKTeX軟件,資源可以在官網上下載https://miktex.org/d

原创 word break II 對字符串根據已知字典 分解出所有可能組合

採用暴力法(brute force 簡稱BF,普通模式匹配)思路:1,首先判斷字符串的第一個字符在不在字典裏,如果在,判斷第二個字符在不在字典裏,如果不在,前兩個字符在不在字典裏,依次迭代;          2,這裏用到了遞歸,如果滿足

原创 LSI最長遞增子序列(DP問題)

子問題:序列a,L[i]表示前i個字符的最大遞增子序列的長度              對L[i+1],遍歷前i個:a[0],,,a[i-1],max{L[i],L[j]+1}  if a[j]<a[i]) 0<=j<i         

原创 OOV問題的解決

1)使用subword的方式來解決,可以使用fasttext工具 訓練詞向量時候會生成subword的詞向量的信息[1]; 2)在訓練詞向量時候,隨機刪除一些詞,置爲unknow,訓練得到的unkonw就是OOV的詞向量信息; 3)ski

原创 LCS-最大公共子序列(DP問題)

對兩個字符串求最大公共子序列,子序列意味着不是連續的序列。    子問題:LCS(s1,s2)表示最大公共子序列      首先基於一個判斷,        1)s1和s2有相同的結尾x,那麼x一定在最大公共子序列中,  LCS(s1,s

原创 輸入一個整數,輸出該數二進制表示中1的個數。其中負數用補碼錶示

題目:輸入一個整數,輸出該數二進制表示中1的個數。其中負數用補碼錶示. class Solution { public:      int  NumberOf1(int n) {          int count=0

原创 機器學習和數據挖掘推薦書單及簡介

有了這些書,再也不愁下了班沒妹紙該咋辦了。慢慢來,認真學,揭開機器學習和數據挖掘這一神祕的面紗吧! 《機器學習實戰》:本書第一部分主要介紹機器學習基礎,以及如何利用算法進行分類,並逐步介紹了多種經典的監督學習算法,如k近鄰算法、樸素貝葉

原创 word-break 對一個字符串根據給出的字典判斷是否可以根據字典切分(DP問題)

對於可用動態規劃求解的問題,一般有兩個特徵:1)最優子結構;2)重疊子問題思路:定義labels[i]表示前i個字符是否可以拆分成字典中的詞,很顯然有        labels[i]=1 if  labels[j] && s[j+1,i

原创 句向量的表示(上)—無監督

參考:https://www.cnblogs.com/llhthinker/p/10335164.html 目錄 1)基於詞向量的詞袋模型       — 平均詞向量與TFIDF加權平均詞向量       — SIF加權平均詞向量   

原创 合唱團算法(DP問題)

題目:有 n 個學生站成一排,每個學生有一個能力值,牛牛想從這 n 個學生中按照順序選取 k 名學生,要求相鄰兩個學生的位置編號的差不超過 d,使得這 k 個學生的能力值的乘積最大,你能返回最大的乘積嗎?類似於前面寫到的LSI最長遞增子序

原创 RF和GBDT和Xgboost的異同總結,加上lightgbm

相同點(照顧標題):    都用到了Bootstrap思想,Bootstrap是一種有放回的抽樣方法思想不同點:    基類器:            RF用的迴歸樹或者分類樹,GBDT和xgboost用的是CART(迴歸樹)    分裂

原创 信息學奧賽一本通 題解目錄

刷題 很全的知識體系轉載:https://blog.csdn.net/u011815404/article/details/79324003第一部分 C++語言第一章 C++語言入門        T1001 Hello,World!