原创 判別式模型與生成式模型
判別式模型 該模型主要對p(y|x)建模,通過x來預測y。在建模的過程中不需要關注聯合概率分佈。只關心如何優化p(y|x)使得數據可分。通常,判別式模型在分類任務中的表現要好於生成式模型。但判別模型建模過程中通常爲有監督的,而且難以被
原创 ARPA的n-gram語言模型格式
先看一下語言模型的格式 [html] view plaincopyprint? \data\ ngram 1=64000 ngram 2=522530 ngram 3=173445 \1-gr
原创 Android入門筆記之人臉識別初學
<1>簡介 Android4.0自帶的人臉識別技術只能識別出人臉在畫面中的位置,中心點,眼間距,角度等基本特性,提供給上層應用使用。 Google 於2006年8月收購Neven Vision 公司(該公司擁有 10 多項應
原创 自然語言處理(NLP)網上資源整理
http://blog.csdn.net/xuh5156/article/details/7437475 最近把一些在網上見到的自然語言處理的資源整理了一下,包括論文列表、軟件資源和一些實驗室主頁、個人主頁等,希望能對NLP研究者
原创 句子對齊工具
1,CTK: Champollion Tool Kit 基於詞彙的,結合句長的。有英語-阿拉伯語、英語-漢語的語言對。 2,Para 用prolog這種語言寫的,具體不清楚。 3,Bilingual Sentence Align
原创 估計概率構造短語翻譯表
經過第三步抽取短語後,獲得基於短語系統使用的翻譯短語對,而接下來的第四步就是短語翻譯表概率估計,它的作用是對翻譯短語對的正確性進行合理的評估。 在上一節,我們得到了短語對集合,如下圖所示: 在這
原创 Android入門筆記之自制電話撥號系統
Android入門筆記之自制電話撥號系統 <1>簡介 自制電話撥號系統,調用系統撥號接口。 <2>關鍵步驟 創建Intent來實現撥號: Intent dial = new Intent
原创 Android入門筆記之File
<1>簡介 利用java的File來訪問android的sdcard <2>關鍵步驟 設置一個currentFile來記錄當前路徑,然後將當前目錄的內容塞入listview中。 <3>出現的問題