原创 QQ盜號核心編程

經常有聽到有朋友QQ被盜的消息,總感覺做出這種行爲的人是可鄙的,不就是對QQ窗口進行監視,然後再是記錄用戶輸入的號碼和密碼,認爲沒什麼了不起。 對於Windows核心編程,本人還是一隻菜鳥,前一段時間把《Windows系統編程》粗略的

原创 java HashMap插入重複Key值問題

今天在用到了HashMap來遍歷所有非重複的Key時遇到了一個問題,在寫入數據庫的時候報錯--主鍵不能重複插入。查看了好久java文檔才得以解決。 自定義一個類型class MyType { private String arga

原创 Adaboost(Adaptive boosting)

Boosting算法的核心思想是,構造一堆diverse的弱分類器(準確率不爲0.5),然後將這些構造好的弱分類器進行融合,達到一個強分類器的效果。Adaboost算法是Boosting ensemble裏面的一種,之所以稱爲Adapti

原创 SVM(Support Vector Machine)讀書筆記二(支持向量和Kernel方法)

在一個線性不可分的樣本中,用添加多次項特徵可以將兩類樣本分開,具體原理請參考 這裏,用SVM分類器也是同樣道理。如果兩類樣本交叉越多,需要越高次的特徵,模型就越複雜,這在存儲上和計算資源上都是很大的開銷。SVM用kernel方法就解決了這

原创 設計模式之-策略模式

問題描述 實現遊戲的不同角色 解決方案 存在問題 策略模式 總結 問題描述 實現遊戲的不同角色 某遊戲中Queen,King,Knight這3種角色,每種角色都有使用武器行爲,設計這三個類,提高代碼的重用性和可維護性。 解決方

原创 LSSVM(Least Squares SVM)與SVR(支持向量迴歸)

SVR的推導 LSSVM(Least Square SVM)是將Kernel應用到ridge regression中的一種方法,它通過將所有樣本用最小二乘誤差進行擬合(這個擬合是在kernel變換過的高維空間),但是LSSVM的缺陷是計算

原创 邏輯迴歸(Logistic Regression)和SVM的聯繫以及Kernel

邏輯迴歸和SVM都是比較理想的分類器,但是各有優缺點,邏輯迴歸不僅可以得到具體的分類類別,還可以得到連續的概率值(因爲邏輯迴歸實質上是迴歸);SVM則可以利用kernel將特徵投影到高維甚至無窮維來更好地擬合數據。這裏我們來看一下邏輯迴歸

原创 Ensemble Learning入門

在機器學習中,已經有了許許多多的模型,比如SVM,邏輯迴歸等等,這些算法有各自的優缺點,並且每種算法也可以產生非常多的不同的模型。如果把這些算法都結合起來,取其所長,或者說把一些比較弱的分類器結合起來形成一個強分類器(boosting),

原创 SVM(Support Vector Machine)讀書筆記三(Soft-margin SVM)

上兩篇講到了hard-margin的SVM以及kernel的原理,利用高斯kernel可以將低維空間轉換到無窮維,將所有樣本分開。但是如果數據中存在一定的噪聲數據,SVM也會將噪聲數據擬合,存在過擬合的風險。Soft-margin SVM

原创 Best coder 2014-3-14題解

zhx's submissions 題目鏈接 簽到題,模擬大數加法,不用進位(要用char[]讀入,string超時) zhx's contest 題目鏈接 可以很快推導出公式爲2^n -2, 這裏由於n和mod都是在lo

原创 SVM(Support Vector Machine)讀書筆記一(最佳分割超平面)

背景 分類問題中,在一個線性不可分的樣本上,通常需要用到一些Non-linear的特徵,把低維度空間上的樣本投影到高維度上,從而使得這些樣本在高維度線性可分。但是這個投影的過程通常也會有以下兩個問題: 如果在原樣本中加了太多的高次多項式

原创 mysql 時間轉換函數的用法

mysql 時間轉換函數的用法2007-10-31 15:03DAYOFWEEK(date)  返回日期date的星期索引(1=星期天,2=星期一, ……7=星期六)。這些索引值對應於ODBC標準。  mysql> select DA

原创 推薦使用scikits.image 進行圖像處理, 比較好用.

看了<<用python做科學計算>>後, 研究了一下圖像處理, opencv很好, 但很不pythonic , PIL有點弱, 後來發現了這個 scikits.image , pypi上得10分的圖像處理庫, 但安裝過程很坎坷, 最後

原创 爲什麼正則化(Regularization)可以減少過擬合風險

在解決實際問題的過程中,我們會傾向於用複雜的模型來擬合複雜的數據,但是使用複雜模型會產生過擬合的風險,而正則化就是常用的減少過擬合風險的工具之一。 過擬合 過擬合是指模型在訓練集上誤差很小,但是在測試集上表現很差(即泛化能力差),過擬合的