Google原生输入法LatinIME词库构建流程分析(二)

原創

2019-04-05 18:53

在Google原生输入法LatinIME词库构建流程分析(一) 中分析LatinIME构建流程进行到了dict_trie->dict_list_->init_list这一步，然后就是构建N-gram信息了，N-gram构建过程在Google原生输入法LatinIME词库构建流程分析(三)--N-gram信息构建中进行了分析，那么接下来继续：

bool DictBuilder::build_dict(const char *fn_raw,
                             const char *fn_validhzs,
                             DictTrie *dict_trie) {  
...
// Construct the NGram information
  NGram& ngram = NGram::get_instance();
  ngram.build_unigram(lemma_arr_, lemma_num_,
                      lemma_arr_[lemma_num_ - 1].idx_by_hz + 1);

  // sort the lemma items according to the spelling idx string
  myqsort(lemma_arr_, lemma_num_, sizeof(LemmaEntry), compare_py);

  get_top_lemmas();

#ifdef ___DO_STATISTICS___
  stat_init();
#endif

  lma_nds_used_num_le0_ = 1;  // The root node
  bool dt_success = construct_subset(static_cast<void*>(lma_nodes_le0_),
                                     lemma_arr_, 0, lemma_num_, 0);
  if (!dt_success) {
    free_resource();
    return false;
  }
...
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Android代码混淆，就这么简单

前言在這個乞丐都精通C++的時代，我們的代碼安全實在是不敢保證，爲了保護我們的代碼不被牛逼的乞丐篡改，代碼混淆還是必須的。大多數人還是認爲代碼混淆是很複雜的事情，我自己也這麼認爲。。。看完這篇博客，也許就會發現，其實沒那麼難

2020-07-08 12:37:11

利用rxjava实现监听EditView里的文字在规定时间间隔不变后进行联想搜索

當EditView輸入的內容變化停止幾秒鐘之後再去後進行搜索， debounce：防抖當一個事件發送出來之後，在約定時間內沒有再次發送這個事件，則發射這個事件，如果再次觸發了，則重新計算時間。 switchMap :當源Observ

丶咿呀咿呀

2020-07-08 12:20:52

在虚拟机中安装android apk

第一步：下載並解壓android SDK到自己硬盤上。第二步：在系統環境變量中增加系統變量SDK_ROOT，並讓它指向android SDK安裝目錄之下的tools文件夾。第三步：在cmd命令狀態下進入android SDK安裝目錄之下的

2020-07-08 11:56:57

Android studio 升级后项目出错

升級完android studio運行項目出現以下錯誤 Default interface methods are only supported starting with Android N (--min-api 24): void a

2020-07-08 11:51:59

Android应对进程被杀死--Service（二）

Service組件在android開發中經常遇到，其經常作爲後臺服務，需要始終保持運行，負責處理一些必要（見不得人）的任務。而一些安全軟件，如360等，會有結束進程的功能，如果不做Service的保持，就會被其殺掉。在早些時

2020-07-08 11:46:59

Windows Running “flutter pub get“ in XXX卡死

Running “flutter pub get” in XXX卡死的主要原因是因爲網絡訪問問題，我們可以通過設置FlutterIO.cn來規避，具體操作如下：右鍵我的電腦->屬性->高級系統設置->環境變量，添加環境變量，

小海编码日记

2020-07-08 12:40:51

Android操作Exif-ExifInterface全解析

簡介： Exif是一種圖像文件格式，它的數據存儲與JPEG格式是完全相同的。實際上Exif格式就是在JPEG格式頭部插入了數碼照片的信息，包括拍攝時的光圈、快門、白平衡、ISO、焦距、日期時間等各種和拍攝條件以及相機品牌、型號、色

2020-07-08 12:37:11

selinux-实现

實現 SELinux SELinux 設爲了“默認拒絕”模式，也就是說，對於在內核中存在鉤子的每一次訪問，都必須獲得政策的明確許可。這意味着政策文件中包含規則、類型、類、權限等方面的大量信息。關於 SELinux 的完整注意事項不在

2020-07-08 12:37:00

selinux-概览

Android 中的安全增強型 Linux 簡介 Android 安全模型部分基於應用沙盒的概念。每個應用都在自己的沙盒內運行。在 Android 4.3 之前的版本中，這些沙盒是通過爲每個應用創建獨一無二的 Linux UID

2020-07-08 12:37:00

selinux-验证

驗證 SELinux Android 強烈建議原始設備製造商 (OEM) 全面測試其 SELinux 實現。製造商在實現 SELinux 時，應先爲設備上需要測試的所有內容應用新政策。應用新政策後，可以通過執行 getenfor

2020-07-08 12:37:00

Android受限广播(protected-broadcast)

在閱讀Android源碼Telephony模塊時，發現在AndroidManifest.xml文件裏聲明瞭大量的protected-broadcast： <protected-broadcast android:name="andr

2020-07-08 12:37:00

selinux-自定义

自定義 SELinux 集成這一基本級別的功能並全面分析結果後，您可以添加自己的政策設置，以便涵蓋自己對 Android 操作系統進行的自定義。當然，這些政策仍必須要滿足 Android 兼容性計劃的要求，並且不會移除默認的 SEL

2020-07-08 12:37:00

在Android端实现基于OPENGL ES 的深度学习前向传播框架

github項目地址首先感謝夕陽嘆大神提供的思路，大家先可以去https://blog.csdn.net/jxt1234and2010/article/details/71056736看看，基本把實現的流程都說了一遍，我照着思路實現了一

2020-07-08 12:23:30

Desire rom - build kernel

參考:http://code.google.com/p/androidteam/wiki/AndroidKernelCompileAndRun 交叉編譯器下載: git clone git://android.git.k

2020-07-08 12:22:51

Android 使用mina框架搭建socket客户端，进行与服务器端通信

注意：在設置編碼過濾的時候一定要注意服務器端和客戶端的編碼要一致 mina框架解釋簡單理解就是：封裝了底層的讀寫流操作，提供高級操作API的通訊框架當前發行的 MINA 版本支持基於Java NIO 技術的 T

2020-07-08 11:46:59

24小時熱門文章

最新文章

最新評論文章