原创 文本分類相關

文本分類入門(一)文本分類問題的定義 文本分類系列文章,從文本分類問題的定義開始,主要講解文本分類系統的構成,主流的統計學習方法以及較爲優秀的SVM算法及其改進。       一個文本(以下基本不區分“文本”和“文檔”兩個詞的含義)

原创 The BM25 Weighting Scheme

This is a technical note about the BM25 weighting scheme, which is the default weighting scheme used by Xapian. Recent

原创 高性能服務器開發

IOCP模型總結(轉) IOCP(I/O Completion Port,I/O完成端口)是性能最好的一種I/O模型。它是應用程序使用線程池處理異步I/O請求的一種機制。在處理多個併發的異步I/O請求時,以往的模型都是

原创 VS 編譯選項

 C/C++ 編譯器選項                                   -優化-   /O1 最小化空間                          /O2 最大化速度 /Ob<n> 內聯擴

原创 ADO 數據庫操作

一、數據庫操作準備 // -------------------------------------------------------------

原创 ADO 屬性

AbsolutePage 屬性 指定當前記錄所在的頁。 設置和返回值 設置或返回從 1 到 Recordset 對象 (PageCount) 所含頁

原创 深入理解拉格朗日乘子法(Lagrange Multiplier) 和KKT條件

在求取有約束條件的優化問題時,拉格朗日乘子法(Lagrange Multiplier) 和KKT條件是非常重要的兩個求取方法,對於等式約束的優化問題,可以應用拉格朗日乘子法去求取最優值;如果含有不等式約束,可以應用KKT條件去求取。當然

原创 開源搜索引擎的比較

開源搜索引擎的比較(一) 開源搜索引擎的比較 A Comparison of Open Source Search Engines Christian Middleton, Ricardo Baeza-Yates

原创 基於Sphinx構建準實時更新的分佈式通用搜索引擎平臺

 億級數據的高併發通用搜索引擎架構設計[原創]  大 | 中 | 小  [ 2008-12-9 08:47 | by 張宴 ]   [文章作者:張宴 本文版本:v1.0 最後修改:2008.12.09 轉載請註明原文

原创 Xapian Search Architecture

This is not strictly a Flax post, but is intended to clarify the Xapian search architecture for people using Xapian

原创 必須的吐槽一次MFC了

最近用MFC 的CFile 寫東西,然後聲明瞭一個 對象,然後就一直用這個對象寫文件,突然bug了, 最後用Getlasterror 一查,fuck,  error =6 = invlid handle  擦,我定義了一個對象,一直在其作

原创 VC使用ado

VC用ADO訪問數據庫全攻略,介紹了VC用ADO來訪問數據庫的各個對象及各方法,很經典,也很實用,很值得一看。  正文  一、ADO概述  ADO是

原创 線程池(thread pool),允許有多個線程同時存在,併發執行,並且這些線程受到統一管理。

 線程池(thread pool),允許有多個線程同時存在,併發執行,並且這些線程受到統一管理。   在Windows Vista中,提供了全新的線程池機制,一般這些線程池中的線程的創建的銷燬是由操作系統自動完成的。   Windo

原创 經典的機器學習方面源代碼庫(非常全,數據挖掘,計算機視覺,模式識別,信息檢索相關領域都適用的了)

經典的機器學習方面源代碼庫(非常全,數據挖掘,計算機視覺,模式識別,信息檢索相關領域都適用的了) 博客分類:  機器學習  編程語言:搞實驗個人認爲當然matlab最靈活了(但是正版很貴),但是更爲前途的是python(n