舉例說明如何用IKAnalyzer實現在android應用程序上面的中文分詞

我用的jar包及其版本爲:IKAnalyzer2012_u6.jar、lucene-analyzers-3.6.1.jar、lucene-highlighter-3.6.1.jar、lucene-core-3.6.1.jar。這些jar包我都上傳到我的資源裏面了,有需要的朋友可以到我的資源裏面去下載,當然,也可以去官方下載。

 

代碼如下:

Participle.java如下:

 

package com.my.participle;

import java.io.IOException;
import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.wltea.analyzer.lucene.IKAnalyzer;

import android.app.Activity;
import android.os.Bundle;
import android.widget.TextView;

public class Participle extends Activity {
 
 private TextView tv01;
 private TextView tv02;
 private static final String s="徐懷鈺是中國臺灣著名流行女歌手、演員、華語樂壇平民天后";
    /** Called when the activity is first created. */
    @Override
    public void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.main);
        tv01=(TextView)findViewById(R.id.tv01);
        tv02=(TextView)findViewById(R.id.tv02);
        tv01.setText(s);
       
        tv02.setText(this.participle(s));
    }
   
    public String participle(String s){
     StringBuilder sb=new StringBuilder();
     String str="";
     Analyzer analyzer=new IKAnalyzer(true);
        StringReader reader=new StringReader(s);
        TokenStream ts=analyzer.tokenStream("", reader);
        CharTermAttribute term=ts.getAttribute(CharTermAttribute.class);
        try {
   while(ts.incrementToken()){
    System.out.print(term.toString()+"|"); 
    sb.append(term.toString()+"|");
   }
   str=sb.toString();
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
        return str;
    }
}

 

 

main.xml如下:

 

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="
http://schemas.android.com/apk/res/android"
    android:layout_width="fill_parent"
    android:layout_height="fill_parent"
    android:orientation="vertical" >

    <TextView
        android:id="@+id/tv01"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content"
        android:text="@string/hello" />
    <TextView
        android:id="@+id/tv02"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"
        />

</LinearLayout>

 

 

下面說明一個問題:在Eclipse中,一個純Java文件與一個Android項目實現中文分詞的區別之處。

在Eclipse中寫一個純java文件時,那些jar包需要通過Build Path-->Configure  Build  Path-->Libraries-->Add  External JARS來直接導入這些jar包,它的項目配置圖如下所示:

 

而在Eclipse中,一個Android項目實現中文分詞時,需要新建一個文件夾(這個文件夾一般以libs來命名),然後把這些jar包及一些配置文件放入這個文件夾中,其項目配置圖如下所示:

 

 

注意:

如果在Android項目中按照一個純Java項目的方法來導入這些Jar包的話,會出現這樣的錯誤:

java.lang.NoClassDefFoundError: org.wltea.analyzer.lucene.IKAnalyzer


 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章