原创 位圖索引的一個應用實例

bitmap 是索引最長常見的一種實現方式。就是bit位的每一位,來作爲表示要索引的對象。通常位圖索引通常表達取值維度取值較少的數據.,最好是布爾值 比如         男 1        婚否 0

原创 java調用libsvm

最近要做文本分類的實現,大概搜了一下發現。java 調用的文章比較少, 參考下 libsvm文件夾下面的幾個類。隨便寫一下。首先把libsvm .jar 加入環境變量和 把幾個類考到src下面 svm_train 和 Svm_pr

原创 java實現 tfidf

轉載我的javaeye久鏈接: http://kobe00712.iteye.com/blog/1088455 tfidf 做自然語言理解的經常用。文檔的作爲權重計算, 許多初學者搞不清楚,權重計算特徵選擇。 針對文本分類而言 作爲很簡

原创 將博客搬至CSDN

將博客搬至CSDN》

原创 雅克比(Jacobian)矩陣

原文地址:雅克比(Jacobian)矩陣作者:彭乾坤   雅可比矩陣   在向量微積分中,雅可比矩陣是一階偏導數以一定方式排列成的矩陣,其行列式稱爲雅可比行列式。 還有,在代數幾何中,代數曲線的雅可比量表示雅可比簇:伴隨該曲

原创 mallet之命令行工具

謝謝 分享能不能在詳細點原文地址:mallet之命令行工具作者:章芝青mallet在目錄/bin下面提供的是shell scripts,本文介紹的是在MyEclipse中使用命令行工具運行分類程序。   一、運行類Text2Vec

原创 多項分佈 多項式分佈

摘要糾錯編輯摘要 二項分佈的典型例子是扔硬幣,硬幣正面朝上概率爲p, 重複扔n次硬幣,k次爲正面的概率即爲一個二項分佈概率。(嚴格定義見伯努利實驗定義)     把二項分佈公式再推廣,就得到了多項分佈。比如扔骰子,不同於扔硬幣,骰子

原创 如何在Struts2中實現系統的初始化…

通常web系統在啓動時需要做一些初始化的工作,比如初始化系統全局變量,加載自定義配置文件,啓動定時任務等。    在Struts中實現系統的初始化工作 在Struts中,我們可以寫一個Servlet讓它繼承於ActionServle

原创 2011年06月20日

轉載我的javaeye久鏈接: http://kobe00712.iteye.com/blog/1088455 tfidf 做自然語言理解的經常用。文檔的作爲權重計算, 許多初學者搞不清楚,權重計算特徵選擇。 針對文本分類而言 作爲很簡

原创 LDA導讀

[論文導讀][教程][介紹]文本處理、圖像標註中的一篇重要論文Latent Dirichlet Allocation 原文信息 Latent Dirichlet Allocation David.M.Blei Andrew.Y.N

原创 歡迎您在新浪博客安家

親愛的朋友:    歡迎您在新浪博客安家,您的博客地址是:http://blog.sina.com.cn/u/1306847877    您可以用文字、圖片、視頻記錄和展示最真實的自我,與網友交流,與線上好友聊天,還能通過手機發表博文和

原创 nutch elipse 配置的一些事項

  再往網上follow很多教程老是出錯,終於發現。   Add Class Folder和Add project 'conf' to build path,設置一個 , 設置了一個就不能再設另一個。反正意思吧conf 加到 path裏