原创 文本分類相關
文本分類入門(一)文本分類問題的定義 文本分類系列文章,從文本分類問題的定義開始,主要講解文本分類系統的構成,主流的統計學習方法以及較爲優秀的SVM算法及其改進。 一個文本(以下基本不區分“文本”和“文檔”兩個詞的含義)
原创 The BM25 Weighting Scheme
This is a technical note about the BM25 weighting scheme, which is the default weighting scheme used by Xapian. Recent
原创 高性能服務器開發
IOCP模型總結(轉) IOCP(I/O Completion Port,I/O完成端口)是性能最好的一種I/O模型。它是應用程序使用線程池處理異步I/O請求的一種機制。在處理多個併發的異步I/O請求時,以往的模型都是
原创 VS 編譯選項
C/C++ 編譯器選項 -優化- /O1 最小化空間 /O2 最大化速度 /Ob<n> 內聯擴
原创 ADO 數據庫操作
一、數據庫操作準備 // -------------------------------------------------------------
原创 ADO 屬性
AbsolutePage 屬性 指定當前記錄所在的頁。 設置和返回值 設置或返回從 1 到 Recordset 對象 (PageCount) 所含頁
原创 深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT條件
在求取有約束條件的優化問題時,拉格朗日乘子法(Lagrange Multiplier) 和KKT條件是非常重要的兩個求取方法,對於等式約束的優化問題,可以應用拉格朗日乘子法去求取最優值;如果含有不等式約束,可以應用KKT條件去求取。當然
原创 開源搜索引擎的比較
開源搜索引擎的比較(一) 開源搜索引擎的比較 A Comparison of Open Source Search Engines Christian Middleton, Ricardo Baeza-Yates
原创 基於Sphinx構建準實時更新的分佈式通用搜索引擎平臺
億級數據的高併發通用搜索引擎架構設計[原創] 大 | 中 | 小 [ 2008-12-9 08:47 | by 張宴 ] [文章作者:張宴 本文版本:v1.0 最後修改:2008.12.09 轉載請註明原文
原创 Xapian Search Architecture
This is not strictly a Flax post, but is intended to clarify the Xapian search architecture for people using Xapian
原创 必須的吐槽一次MFC了
最近用MFC 的CFile 寫東西,然後聲明瞭一個 對象,然後就一直用這個對象寫文件,突然bug了, 最後用Getlasterror 一查,fuck, error =6 = invlid handle 擦,我定義了一個對象,一直在其作
原创 VC使用ado
VC用ADO訪問數據庫全攻略,介紹了VC用ADO來訪問數據庫的各個對象及各方法,很經典,也很實用,很值得一看。 正文 一、ADO概述 ADO是
原创 線程池(thread pool),允許有多個線程同時存在,併發執行,並且這些線程受到統一管理。
線程池(thread pool),允許有多個線程同時存在,併發執行,並且這些線程受到統一管理。 在Windows Vista中,提供了全新的線程池機制,一般這些線程池中的線程的創建的銷燬是由操作系統自動完成的。 Windo
原创 經典的機器學習方面源代碼庫(非常全,數據挖掘,計算機視覺,模式識別,信息檢索相關領域都適用的了)
經典的機器學習方面源代碼庫(非常全,數據挖掘,計算機視覺,模式識別,信息檢索相關領域都適用的了) 博客分類: 機器學習 編程語言:搞實驗個人認爲當然matlab最靈活了(但是正版很貴),但是更爲前途的是python(n