清華大學開源了一項神器,已經在GitHub爆了

最近,清華大學在GitHub開源了一項神器叫萬詞王(Want Wrong),號稱是首個支持中文及跨語言查詢的開源在線反向詞典。

什麼叫反向詞典呢?普通的詞典告訴你某個詞語的定義,而反向詞典恰好相反,可以告訴你哪些詞語符合你輸入描述的意思。下圖爲萬詞王在線反向詞典的頁面截圖,其中演示了反向查詞的一個示例,輸入“山非常高”,系統將返回一系列模型認爲表達“山非常高”意思的詞語,例如“高峻”、“巍峨”等。

反向詞典可以用來做什麼?

解決“舌尖現象”(tip-of-the-tongue,又稱話到嘴邊說不出來),即暫時性忘詞的問題

幫助語言學習者學習、鞏固詞彙

改善選詞性失語者患者的生活質量,該病的症狀是可以識別並描述一個物體,但是無法記起該物體的名字

簡單來說,就是現在的年輕人都會有詞窮的時候,當你詞窮的時候,這個工具就可以派上用場了,比如你心慌意亂拿不定主意的時候,不知道用哪個詞,你就可以將它輸進去,就會得到猶豫不決、不意亂心慌等100個詞語。而且詞性和韻腳也是可以自定義選擇。


萬詞王的核心模型是之前清華大學計算機系自然語言處理實驗室(THUNLP)發表在AAAI-20上的一篇論文提出的多通道反向詞典模型:Multi-channel Reverse Dictionary Model [論文] [代碼],其模型架構如下所示:

關於清華大學自然語言處理與社會人文計算實驗室

清華大學計算機系自然語言處理與社會人文計算實驗室(THUNLP)成立於20世紀70年代末,最初在黃昌寧教授的帶領下從事中文信息處理方面的研究工作,是國內開展自然語言處理研究最早、深具影響力的科研單位,同時也是中國中文信息學會(全國一級學會)計算語言學專業委員會的掛靠單位。實驗室學術帶頭人爲孫茂松教授,實驗室教師隊伍還包括劉洋教授和劉知遠副教授。實驗室面向以中文爲核心的自然語言處理前沿基礎課題開展系統深入的研究工作,研究領域涵蓋計算語言學的核心問題以及社會計算和人文計算,近年來在973、863、國家自然科學基金等項目的支持下,實驗室師生在IJCAI、AAAI、ACL、EMNLP等國際頂級會議和期刊上發表多篇高水平學術論文,與CMU、NUS、Google等國際名校和企業有長期良好的合作關係,培養的優秀畢業生大多到清華大學、谷歌、百度、阿里、微軟等著名高校和企業工作。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章