原创 Lucene 分詞

分詞的基本原理: 1、分詞是用來對文本按語言特徵按算法進行過濾、分組處理的一種技術。 2、分詞的對象是文本,而不是圖像動畫腳本等等。 3、分詞的方式就是過濾和分組。 4、過濾主要把文本中那些沒有實際意義的字或詞過濾掉。

原创 Java解析 WORD

一、POI對Word處理 1、讀取Word 1、讀取Excel 3、下載地址:http://www.apache.org/dyn/closer.cgi/poi/dev/ 代碼實現: package com.qianyan.

原创 Lucene 搜索二

Lucene分頁搜索的實現: [java] view plaincopy package com.qianyan.lucene;      import java.io.IOException;      impo

原创 Java文檔 XML

認識XML XML(Extensible Markup Language)即可擴展標記語言,它與HTML一樣,都是SGML(Standard Generalized Markup Language,標準通用標記語言)。XML是Inte

原创 Java解析 HTML

一、垂直搜索介紹 1、垂直搜索--即需要抓去大量的網頁,分析其中的數據。垂直搜索更着重於正文內容模式分離,數據調整,相關鏈接分析,是一種結構化分析過程。 2、垂直搜索技術主要分爲兩個層次:模版級和網頁庫級 3、模版級是針對網頁進行

原创 Lucene 基本概念

首先、要做一個自己的企業內部搜素引擎呢,要認識Lucene: 1、Lucene的貢獻者Doug Cutting是一位自身全文索引/檢索專家,曾經是V-Twin搜索引擎(Apple的Copland操作系統的成就之一)的主要開發者

原创 Java解析 Excel

java解析Excel 使用到jxl.jar   百度百科:http://baike.baidu.com/view/1327707.htm 加載Excel import java.io.File; import jxl.Sheet;

原创 CKEditor與CKFinder整合並實現文件上傳功能

一.需要的資源: 用到的網站,文件自己下載: a) ckeditor_3.6.2 (解壓)download.cksource.com/CKEditor/CKEditor/CKEditor%203.6.2/ckeditor_3.6.

原创 Java解析 PDF

1、使用PDFBox處理PDF文檔PDF全稱Portable Document Format,是Adobe公司開發的電子文件格式。這種文件格式與操作系統平臺無關,可以在Windows、Unix或Mac OS等操作系統上通用。PDF文件格式

原创 Web Service 那點事兒 —— 使用 CXF 開發 SOAP 服務

原文地址:http://my.oschina.net/huangyong/blog/286439 選框架猶如選媳婦,選來選去,最後我還是選了“醜媳婦(CXF)”,爲什麼是它?因爲 CXF 是 Apache 旗下的一款非常優

原创 AOP那些事兒

原文地址:http://my.oschina.net/huangyong/blog/161338 又是一個週末,剛給寶寶喂完牛奶,終於讓她睡着了。所以現在我才能騰出手來,坐在電腦面前給大家寫這篇文章。 今天我要和大家分享的是

原创 Web Service 那點事兒-基本概念和JDK發佈調用

原文地址:http://my.oschina.net/huangyong/blog/286155 Web Service,即“Web 服務”,簡寫爲 WS,從字面上理解,它其實就是“基於 Web 的服務”。而服務卻是雙方的,有服

原创 Spring高級事務管理難點剖析

1Spring事務傳播行爲 所謂事務傳播行爲就是多個事務方法相互調用時,事務如何在這些方法間傳播。Spring支持7種事務傳播行爲 PROPAGATION_REQUIRED(加入已有事務) 如果當前沒有事務,就新建一個事務,如果已

原创 nodejs入門——搭建一個聊天室應用

個人博客 http://mvc.coding.io/ 1入門教程推薦 node入門 很早之前看的就是這個,比較淺顯易懂,看一遍就明白nodejs到底是怎麼一回事兒了 2開源項目 昨天在coding上看到了一個nodejs聊

原创 verlet-js物理引擎

verlet-js是一個使用JavaScript編寫的物理引擎,支持粒子系統、距離約束、角度約束等,通過verlet-js,你可以在應用中實現一些非常酷的、具備物理特性的效果,比如碰撞、滾動、滑動或彈跳。 verlet-js的一些特性如