Luence中文分詞的簡單例子

原創

Ada168855

2020-06-24 20:02

我用的是NetBeans的編程軟件，首先建立一個java項目Luence.java，項目配置如下圖：

程序如下：

package paodingtest;

import java.io.IOException;
import java.io.StringReader;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;

/**
*
* @author Administrator
*/
public class LuenceTest {

    /**
     * @param args the command line arguments
     */
    public static void main(String[] args) throws IOException {
        // TODO code application logic here
        Analyzer analyzer=new StandardAnalyzer();//標準過濾停用次

        //Analyzer analyzer = new SimpleAnalyzer();//簡單地過濾空格和符號
        //Analyzer analyzer = new CJKAnalyzer();//中文進行兩字兩字拆分，英文和StandardAnalyzer功能一樣
        //Analyzer analyzer = new WhitespaceAnalyzer();//過濾空格
        //Analyzer analyzer = new ChineseAnalyzer();//拆分每個字符，過濾符號（即把一句話拆分成一個一個漢字，不顯示符號）

        TokenStream tokenStream=analyzer.tokenStream(" ",new StringReader("關於lucene實現中文分詞的簡單例子"));
        Token token=new Token();
        while(null!=tokenStream.next(token))
            System.out.print(token.term()+"|");
        System.out.println();
    }


}

運行結果如下：

run：
關|於|lucene|實|現|中|文|分|詞|的|簡|單|例|子|
成功生成（總時間：0 秒）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Luence中文分詞的簡單例子

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（三）數據卷掛載NFS（網絡文件系統）

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

舉例說明在android中使用正則表達式去掉字符串中標點符號及其他一些特殊符號的方法

舉例說明android進行初始化組件並設置組件屬性的簡便方法

舉例說明如何用IKAnalyzer實現在android應用程序上面的中文分詞

直接插入排序算法知識總結

android編程中遇到的Caused by: android.view.InflateException: Binary XML file line #13錯誤的原因及解決辦法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結