隨筆-機器如何學習我們的知識?

1、 人類語言的語法知識。

不同的人類語言有不同的語言表達形式,包括語言符號,語言符號的組合和應用規則。阿拉伯文字、斯拉夫文字、羅馬文字、拉丁文字、象形文字等代表着不同語言背景、語言文化。

2、 機器可用的詞典知識庫有哪些?

1) 類別詞庫。特定實體詞、功能詞、非功能詞。
2) 組合詞庫。組合詞庫包括搭配詞庫,共現詞庫。
a) 搭配詞庫:
i. 位置共現:窗口共現、互信息、卡方
ii. 句法共現:成份共現(VP/NP)、依存共現(SBV,VOB,ATT,POB等)
iii. 語義共現:語義角色共現(工具,結果,趨向)
iv. 概念共現:同義詞標準化、上位詞、反義詞等替換標準化
3) 替換詞庫。同義詞庫,兄弟節點詞庫,父親節點詞庫,兒子節點詞庫

3、 語言模板的自我習得?

藉助句子非主要成分移除,成份位置規則。
1) 手工枚舉下的語言模板
2) 基於事實實例自舉方式的語言模板生成
3) 基於類型符號替換的語言模板生成

4、 推理規則的自我習得?

1) 基於關係事實的推理規則反推
2) 基於類概念的推理規則生成
3) 基於類屬性或描述的推理規則生成

5、 語料的自我擴充?

語料的自我擴充分成兩個,一個是從無到有,另一個是從少到多。
1) 基於回標的方式。確定標準句,對回標候選句進行置信度評分。
2) 基於回譯的方式。翻譯成中間語言,再反向翻譯回來,形成另一種表述形式。
3) 基於句式遷移的方式。陳述句,否定句,祈使句、被字句、把字句。定語後置、狀語前置等變換句法。
4) 基於同義詞替換的方式。擴展問的常用方式。
5) 基於概念體系替換的方式。
6) 基於非功能詞插入和刪除的方式。
7) 基於搭配與語言模型的生成方式。基於給定詞,結合搭配信息和語言成立性模型進行語言實例生成。
8) 基於生成對抗網絡的語言實例生成。

6、 人類的語言能力體現在能夠在不同句式上來回變通

1) 縮句:把結構比較複雜的句子中的修飾、限制和補充說明的成分去掉保留主要成分的意思。簡單地說:縮句就像把一棵樹的樹枝、枝葉都去掉,只留下樹的主幹一樣。
縱橫交錯的河道里穿行着行動輕快靈活的小艇(縮句)河道里穿行着小艇。
運動健兒的臉上露出了勝利的喜悅。 (縮句)臉上露出了喜悅。
我們要把時間當成生命一樣愛惜。(縮句)我們要把時間愛惜。
六歲的弟弟津津有味地喫着又香又甜的蘋果。(縮句)弟弟喫着蘋果。
一隻從樹上掉下來的小麻雀無可奈何的拍打着小翅膀。麻雀拍打着翅膀。
2)去“枝”留“幹”法;凡是用來進行修飾或限制的詞都儘量去掉,包括 :形容詞、數量詞、表示程度、時間、地點的詞。

7、 如何更好地將語言學家的工作計算機化,句子轉寫器。

1)底層的語言實例是千變萬化的,往上走,詞性組合模式回少一些,再往上走,句法組合模式會少一些,再往上走,語義模式會更少一些。語言是遵從一定的模式和組合規則形成的。語言的生成是一種抽象語言模式的實例化過程。

8、語言規則與分佈式表示的對抗,規則的形式化、數值化。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章