原创 Trie樹和Ternary Search樹的學習總結

Trie樹和Ternary Search樹的學習總結 1.1.1 摘要 Trie樹,又稱字典樹,單詞查找樹或者前綴樹,是一種用於快速檢索的多叉樹結構,如英文字母的字典樹是一個26叉樹,數字的字典樹是一個10叉樹。 三叉搜索樹是一種特殊的

原创 基於K-Means的文本聚類算法

源代碼下載:TDIDF_Demo.rar         聲明:本文代碼思路完全來自蛙蛙池塘的博客,只爲技術交流用途,無其他目的       昨天有幸拜讀了蛙蛙池塘的《蛙蛙推薦:蛙蛙教你文本聚類》這篇文章,受益匪淺,於是今天就動手嘗試照着

原创 基於TextRank的中文摘要抽取算法(一)

BM25算法,通常用來作搜索相關性平分。一句話概況其主要思想:對Query進行語素解析,生成語素qi;然後,對於每個搜索結果D,計算每個語素qi與D的相關性得分,最後,將qi相對於D的相關性得分進行加權求和,從而得到Query與D的相關

原创 INSERT ... ON DUPLICATE KEY UPDATE

向數據庫插入記錄時,有時會有這種需求,當符合某種條件的數據存在時,去修改它,不存在時,則新增,也就是saveOrUpdate操作。這種控制可以放在業

原创 用git上傳本地項目到github上

1.首先確認自己已經安裝了git,打開git bash,輸入ssh-keygen -t rsa -C "自己的郵箱地址@XXX.com" ,生成自己的公鑰與私鑰 2.一路默認回車,會生成公鑰、私鑰到以下文件夾下id_rsa是私鑰,

原创 Git 常用命令速查表

1、常用的Git命令 命令 簡要說明 git add 添加至暫存區 git add–interactive 交互式添加 git apply 應用補丁 git am 應用郵件格式補丁 git an

原创 Restful風格API接口開發springMVC篇

Restful風格的API是一種軟件架構風格,設計風格而不是標準,只是提供了一組設計原則和約束條件。它主要用於客戶端和服務器交互類的軟件。基於這個風格設計的軟件可以更簡潔,更有層次,更易於實現緩存等機制。 在Restful風格中,用戶請求

原创 使用CheckedOutputStream和CheckedInputStream實現帶驗證的壓縮、解壓

轉自http://ajava.orghttp://ajava.org/article-1133-1.html   下面例子演示如何通過CheckedOutputStream和CheckedInputStream實現帶驗證的壓縮、解壓。 採

原创 初始ZooKeeper與集羣搭建實例

zookeeper是什麼 Zookeeper,一種分佈式應用的協作服務,是Google的Chubby一個開源的實現,是Hadoop的分佈式協調服務,它包含一個簡單的原語集,應用於分佈式應用的協作服務,使得分佈式應用可以基於這些接口實現諸如

原创 JSTL中的fn函數

JSTL(fn函數)    首先,我們要在頁面的最上方引用: <%@ taglib prefix="fn" uri="http://Java.sun.com/jsp/jstl/functions" %>   下面是JSTL中自帶的方法

原创 mysql show processlist命令 詳解

Analyzing 線程是對MyISAM 表的統計信息做分析(例如, ANALYZE TABLE )。 checking permissions 線程是檢查服務器是否具有所需的權限來執行該語句。 Checking table

原创 jquery 彈出浮層(div) + 遮蔽層

<style type="text/css">         .pop-box {               z-index: 9999; /*

原创 WebService學習整理(一)——客戶端三種調用方式

1 WebService基礎 1.1 作用 1,       WebService是兩個系統的遠程調用,使兩個系統進行數據交互,如應用: 天氣預報服務、銀行ATM取款、使用郵箱賬號登錄各網站等。 2,       WebService

原创 ehcache使用詳解

在開發高併發量,高性能的網站應用系統時,緩存Cache起到了非常重要的作用。本文主要介紹EHCache的使用,以及使用EHCache的實踐經驗。筆者使用過多種基於Java的開源Cache組件,其中包括OSCache、JBossCach

原创 IK分詞器原理與源碼分析

IK分詞器原理與源碼分析 原文:http://3dobe.com/archives/44/ 引言 做搜索技術的不可能不接觸分詞器。個人認爲爲什麼搜索引擎無法被數據庫所替代的原因主要有兩點,一個是在數據量比較大的時候,搜索引擎的查詢速度快