原创 位圖索引的一個應用實例
bitmap 是索引最長常見的一種實現方式。就是bit位的每一位,來作爲表示要索引的對象。通常位圖索引通常表達取值維度取值較少的數據.,最好是布爾值 比如 男 1 婚否 0
原创 java調用libsvm
最近要做文本分類的實現,大概搜了一下發現。java 調用的文章比較少, 參考下 libsvm文件夾下面的幾個類。隨便寫一下。首先把libsvm .jar 加入環境變量和 把幾個類考到src下面 svm_train 和 Svm_pr
原创 java實現 tfidf
轉載我的javaeye久鏈接: http://kobe00712.iteye.com/blog/1088455 tfidf 做自然語言理解的經常用。文檔的作爲權重計算, 許多初學者搞不清楚,權重計算特徵選擇。 針對文本分類而言 作爲很簡
原创 將博客搬至CSDN
將博客搬至CSDN》
原创 雅克比(Jacobian)矩陣
原文地址:雅克比(Jacobian)矩陣作者:彭乾坤 雅可比矩陣 在向量微積分中,雅可比矩陣是一階偏導數以一定方式排列成的矩陣,其行列式稱爲雅可比行列式。 還有,在代數幾何中,代數曲線的雅可比量表示雅可比簇:伴隨該曲
原创 mallet之命令行工具
謝謝 分享能不能在詳細點原文地址:mallet之命令行工具作者:章芝青mallet在目錄/bin下面提供的是shell scripts,本文介紹的是在MyEclipse中使用命令行工具運行分類程序。 一、運行類Text2Vec
原创 多項分佈 多項式分佈
摘要糾錯編輯摘要 二項分佈的典型例子是扔硬幣,硬幣正面朝上概率爲p, 重複扔n次硬幣,k次爲正面的概率即爲一個二項分佈概率。(嚴格定義見伯努利實驗定義) 把二項分佈公式再推廣,就得到了多項分佈。比如扔骰子,不同於扔硬幣,骰子
原创 如何在Struts2中實現系統的初始化…
通常web系統在啓動時需要做一些初始化的工作,比如初始化系統全局變量,加載自定義配置文件,啓動定時任務等。 在Struts中實現系統的初始化工作 在Struts中,我們可以寫一個Servlet讓它繼承於ActionServle
原创 2011年06月20日
轉載我的javaeye久鏈接: http://kobe00712.iteye.com/blog/1088455 tfidf 做自然語言理解的經常用。文檔的作爲權重計算, 許多初學者搞不清楚,權重計算特徵選擇。 針對文本分類而言 作爲很簡
原创 LDA導讀
[論文導讀][教程][介紹]文本處理、圖像標註中的一篇重要論文Latent Dirichlet Allocation 原文信息 Latent Dirichlet Allocation David.M.Blei Andrew.Y.N
原创 歡迎您在新浪博客安家
親愛的朋友: 歡迎您在新浪博客安家,您的博客地址是:http://blog.sina.com.cn/u/1306847877 您可以用文字、圖片、視頻記錄和展示最真實的自我,與網友交流,與線上好友聊天,還能通過手機發表博文和
原创 nutch elipse 配置的一些事項
再往網上follow很多教程老是出錯,終於發現。 Add Class Folder和Add project 'conf' to build path,設置一個 , 設置了一個就不能再設另一個。反正意思吧conf 加到 path裏