iBus拼音輸入法導入搜狗詞庫

(Ubuntu論壇看到的導入詞庫,故轉載地址及部分內容,留作資料參考。)

源地址:http://forum.ubuntu.org.cn/viewtopic.php?f=8&t=252407

更新:

http://code.google.com/p/hslinuxextra/downloads/list

上面的地址中,增加了三個詞庫文件和工程的源代碼,有興趣的同學可以自己去搞搞。

三個詞庫文件分別爲:精簡的詞庫、較全面的詞庫和非常全面的詞庫,自己下載解壓後使用。

另外,很多人說詞頻不對,我現在調整了一下邏輯:ibus中詞頻信息沒做任何變化,而fcitx中原有詞頻是較高等級而新詞等級較低。

ibus pinyin要求最低爲1.3.0,這個大家注意一下。

大家需要注意的是,不同版本甚至同一個版本不同發行版上詞庫db的目錄可能不一樣

請根據您自己的發行版和版本查找對應的文件覆蓋

另外,經過與ibus開發者協商,ibus-pinyin的詞庫查找規則做了一些更改,只要在詞庫目錄(就是有一個.db文件的那個目錄,一般是/usr/share/ibus-pinyin/db目錄)把新詞庫複製過來並改名爲local.db就可以使用了,如果感覺詞庫不好直接刪除掉local.db就可以讓ibus使用原來的詞庫。




這兩天,真的很累,沒有一刻閒着的,公司的事情太多,太累了。

忙着無聊的時候,去搜狐的輸入法網站上轉了轉,發現它竟然能下輸入法詞庫文件

這個詞庫,utf-16編碼的,反向出來以後,我給導入到了ibus拼音輸入法裏面了

唉,大家別怪我

去下面這個地址下載下來

http://code.google.com/p/hslinuxextra/downloads/list上的android.7z

或者直接點擊鏈接:

http://hslinuxextra.googlecode.com/files/android.7z

然後解壓,你應該會看到一個android.db文件,把這個文件放到/usr/share/ibus-pinyin/db裏面,覆蓋同名的db文件

不過有的同學ibus-pinyin的詞庫是openphrase的,反正這個目錄裏面只有一個db文件,你用你下載解壓的那個文件改名後覆蓋掉就行了

覆蓋以後,你把ibus重啓一下,如果你能打出下面的這個詞組,說明生效了:

代碼:
弗雷德霍姆行列式


我的這個詞庫,基於ibus原有的android詞庫文件,另外增加了搜狐的下列詞庫:
代碼:

IT計算機 電腦詞彙大全        歷史名人大全  搜狗標準大詞庫        醫學詞彙大全
財會詞彙大全          電子計算機通信專業術語農業詞彙大全  搜狗精選詞庫          藝術家小辭海
常用餐飲詞彙【官方推薦】電子術語大全        農業類詞庫    搜狗萬能詞庫          音樂大雜燴
常用植物名            動物詞彙大全        農業系統擴充詞庫唐詩宋詞成語俗語      飲食詞彙大全
蟲蛇類名詞            概率與數理統計詞庫pro 全面詞庫      網絡流行新詞          影視歌名庫
船舶港口詞彙大全      化學詞彙大全        詩詞名句大全  網上最全的11.44萬全國四級行政區劃詞庫職業作家詞庫
地理地質詞彙大全      機械工程詞彙大全    書法詞庫大全  藥品名稱大全          最詳細的全國地名大全
地質大詞典            計算機名詞          搜狗標準詞庫  醫學詞彙大全 (1)





我知道我的行爲不妥,但是我的目的是讓大家能學到新的詞語

望大家勿怪

PS:我發現這個詞庫雖然比較大,但是實際佔用內存不多,ibus的相應也挺迅速


---------------------------我是華麗的分割線-----------------------------------

另外,我增加了fcitx的詞庫:pyPhrase.org pyphrase.mb pybase.mb

http://hslinuxextra.googlecode.com/files/fcitx.7z

下載並解壓

其中pyphrase.mb pybase.mb是編譯好的詞庫,連同pyPhrase.org直接覆蓋已經安裝好的fcitx中的同名文件即可:/usr/share/fcitx/data中(把解壓後的三個文件同時覆蓋fcitx原有文件)

pyPhrase.org是源文件,編譯時覆蓋源代碼目錄的同名文件,也同樣會生成pyphrase.mb。

請同學們多加使用

另外,由於ibus使用的sql,所以兼容性問題不大,但是對於fcitx來說可能會有問題出現,如果你的不能用,那麼用下面的命令自己根據pyPhrase來做mb文件:

代碼:
createPYMB /usr/share/fcitx/data/gbkpy.org ./pyPhrase.org


把生成的mb文件連同pyPhrase.org覆蓋掉fcitx安裝的data文件就可以了

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章