原创 判別式模型與生成式模型

判別式模型 該模型主要對p(y|x)建模,通過x來預測y。在建模的過程中不需要關注聯合概率分佈。只關心如何優化p(y|x)使得數據可分。通常,判別式模型在分類任務中的表現要好於生成式模型。但判別模型建模過程中通常爲有監督的,而且難以被

原创 ARPA的n-gram語言模型格式

先看一下語言模型的格式 [html] view plaincopyprint? \data\   ngram 1=64000   ngram 2=522530   ngram 3=173445      \1-gr

原创 Android入門筆記之人臉識別初學

<1>簡介        Android4.0自帶的人臉識別技術只能識別出人臉在畫面中的位置,中心點,眼間距,角度等基本特性,提供給上層應用使用。 Google 於2006年8月收購Neven Vision 公司(該公司擁有 10 多項應

原创 自然語言處理(NLP)網上資源整理

http://blog.csdn.net/xuh5156/article/details/7437475 最近把一些在網上見到的自然語言處理的資源整理了一下,包括論文列表、軟件資源和一些實驗室主頁、個人主頁等,希望能對NLP研究者

原创 句子對齊工具

1,CTK: Champollion Tool Kit 基於詞彙的,結合句長的。有英語-阿拉伯語、英語-漢語的語言對。 2,Para 用prolog這種語言寫的,具體不清楚。 3,Bilingual Sentence Align

原创 估計概率構造短語翻譯表

 經過第三步抽取短語後,獲得基於短語系統使用的翻譯短語對,而接下來的第四步就是短語翻譯表概率估計,它的作用是對翻譯短語對的正確性進行合理的評估。         在上一節,我們得到了短語對集合,如下圖所示:         在這

原创 Android入門筆記之自制電話撥號系統

Android入門筆記之自制電話撥號系統 <1>簡介 自制電話撥號系統,調用系統撥號接口。 <2>關鍵步驟        創建Intent來實現撥號:                    Intent dial = new Intent

原创 Android入門筆記之File

<1>簡介        利用java的File來訪問android的sdcard <2>關鍵步驟        設置一個currentFile來記錄當前路徑,然後將當前目錄的內容塞入listview中。 <3>出現的問題