原创 Trie樹和Ternary Search樹的學習總結
Trie樹和Ternary Search樹的學習總結 1.1.1 摘要 Trie樹,又稱字典樹,單詞查找樹或者前綴樹,是一種用於快速檢索的多叉樹結構,如英文字母的字典樹是一個26叉樹,數字的字典樹是一個10叉樹。 三叉搜索樹是一種特殊的
原创 基於K-Means的文本聚類算法
源代碼下載:TDIDF_Demo.rar 聲明:本文代碼思路完全來自蛙蛙池塘的博客,只爲技術交流用途,無其他目的 昨天有幸拜讀了蛙蛙池塘的《蛙蛙推薦:蛙蛙教你文本聚類》這篇文章,受益匪淺,於是今天就動手嘗試照着
原创 基於TextRank的中文摘要抽取算法(一)
BM25算法,通常用來作搜索相關性平分。一句話概況其主要思想:對Query進行語素解析,生成語素qi;然後,對於每個搜索結果D,計算每個語素qi與D的相關性得分,最後,將qi相對於D的相關性得分進行加權求和,從而得到Query與D的相關
原创 INSERT ... ON DUPLICATE KEY UPDATE
向數據庫插入記錄時,有時會有這種需求,當符合某種條件的數據存在時,去修改它,不存在時,則新增,也就是saveOrUpdate操作。這種控制可以放在業
原创 用git上傳本地項目到github上
1.首先確認自己已經安裝了git,打開git bash,輸入ssh-keygen -t rsa -C "自己的郵箱地址@XXX.com" ,生成自己的公鑰與私鑰 2.一路默認回車,會生成公鑰、私鑰到以下文件夾下id_rsa是私鑰,
原创 Git 常用命令速查表
1、常用的Git命令 命令 簡要說明 git add 添加至暫存區 git add–interactive 交互式添加 git apply 應用補丁 git am 應用郵件格式補丁 git an
原创 Restful風格API接口開發springMVC篇
Restful風格的API是一種軟件架構風格,設計風格而不是標準,只是提供了一組設計原則和約束條件。它主要用於客戶端和服務器交互類的軟件。基於這個風格設計的軟件可以更簡潔,更有層次,更易於實現緩存等機制。 在Restful風格中,用戶請求
原创 使用CheckedOutputStream和CheckedInputStream實現帶驗證的壓縮、解壓
轉自http://ajava.orghttp://ajava.org/article-1133-1.html 下面例子演示如何通過CheckedOutputStream和CheckedInputStream實現帶驗證的壓縮、解壓。 採
原创 初始ZooKeeper與集羣搭建實例
zookeeper是什麼 Zookeeper,一種分佈式應用的協作服務,是Google的Chubby一個開源的實現,是Hadoop的分佈式協調服務,它包含一個簡單的原語集,應用於分佈式應用的協作服務,使得分佈式應用可以基於這些接口實現諸如
原创 JSTL中的fn函數
JSTL(fn函數) 首先,我們要在頁面的最上方引用: <%@ taglib prefix="fn" uri="http://Java.sun.com/jsp/jstl/functions" %> 下面是JSTL中自帶的方法
原创 mysql show processlist命令 詳解
Analyzing 線程是對MyISAM 表的統計信息做分析(例如, ANALYZE TABLE )。 checking permissions 線程是檢查服務器是否具有所需的權限來執行該語句。 Checking table
原创 jquery 彈出浮層(div) + 遮蔽層
<style type="text/css"> .pop-box { z-index: 9999; /*
原创 WebService學習整理(一)——客戶端三種調用方式
1 WebService基礎 1.1 作用 1, WebService是兩個系統的遠程調用,使兩個系統進行數據交互,如應用: 天氣預報服務、銀行ATM取款、使用郵箱賬號登錄各網站等。 2, WebService
原创 ehcache使用詳解
在開發高併發量,高性能的網站應用系統時,緩存Cache起到了非常重要的作用。本文主要介紹EHCache的使用,以及使用EHCache的實踐經驗。筆者使用過多種基於Java的開源Cache組件,其中包括OSCache、JBossCach
原创 IK分詞器原理與源碼分析
IK分詞器原理與源碼分析 原文:http://3dobe.com/archives/44/ 引言 做搜索技術的不可能不接觸分詞器。個人認爲爲什麼搜索引擎無法被數據庫所替代的原因主要有兩點,一個是在數據量比較大的時候,搜索引擎的查詢速度快