清華大學自然語言處理與社會人文計算研究中心成立!

  2019 年 7 月 1 日,清華大學人工智能研究院自然語言處理與社會人文計算研究中心成立儀式暨學術報告與開元成功發佈會在清華大學 FIT 樓舉行。這是繼知識智能研究中心、聽覺智能研究中心、基礎理論研究中心、智能機器人研究中心、智能人機交互研究中心、智能信息獲取研究中心、視覺智能研究中心之後成立的第八個研究中心。清華大學副校長、清華大學人工智能研究院管委會主任尤政院士,清華大學人工智能研究院院長張鈸院士出席成立儀式並共同爲中心揭牌。清華大學人工智能研究院院長助理朱軍教授主持了成立儀式。

  

清華大學自然語言處理與社會人文計算研究中心成立!


  尤政院士與張鈸院士爲中心揭牌

  尤政院士與張鈸院士致辭

  尤政院士在致辭中指出,自然語言處理一直以來都是計算機科學領域的一個重要方向,也被稱爲「人工智能皇冠上的明珠」,是人工智能技術當下和未來發展的戰略制高點。而清華大學作爲國內最早開展自然語言處理的單位之一,經過四十年的不懈努力,已經發展成國內外自然語言處理研究的一方重鎮。因此,中心的成立對於推動清華大學人工智能的深入發展具有十分重要的意義。

  將自然語言處理與社會科學及人文科學相結合,具有大跨度學科交叉的性質。這既是人工智能研究本身的積極拓展,也是對傳統學科在人工智能時代的守正出新。希望中心能夠凝聚清華自然語言處理研究力量,加強與人文社科學科的交叉合作,開展具有世界水平的自然語言處理基礎理論研究和關鍵技術創新,服務於清華與國家的人工智能發展戰略。

  

清華大學自然語言處理與社會人文計算研究中心成立!


  尤政院士致辭

  張鈸院士代表清華大學人工智能研究院致辭。他指出語言是人類智能的重要標誌,機器自然語言理解是人工智能的終極目標。清華大學在自然語言處理方面有着深厚的研究積澱,1978 年成立人工智能與智能控制教研組時,自然語言處理就是其中的重要研究方向之一,在黃昌寧教授領導下迅速發展成爲國內領軍的研究單位。

  新成立的中心將致力於實現自然語言處理與人文社科的深度融合,不僅僅是將人工智能技術融入人文社科領域,更需要從語言、社會學、人文學等人文社科的多個角度來反觀人類智能的本質,這是研究院人工智能基礎研究的重要組成部分。希望中心再接再厲,在自然語言處理與社會學、人文學的交叉研究上形成特色,引領我國自然語言處理和社會人文計算研究領域的發展。

  

清華大學自然語言處理與社會人文計算研究中心成立!


  張鈸院士致辭

  致辭結束後,尤政院士與張鈸院士共同爲自然語言處理與社會人文計算研究中心揭牌,並向清華大學人工智能研究院常務副院長孫茂松教授頒發了中心主任聘書。研究中心同時聘請了中國中文信息學會原理事長、×××院士倪光南,滑鐵盧大學講座教授、加拿大×××科學院院士李明,微軟亞洲研究院副院長、國際計算語言學會會長周明,英國帝國理工學院數據科學研究所所長、英國×××工程院院士郭毅可爲學術顧問。

  

清華大學自然語言處理與社會人文計算研究中心成立!


  孫茂松教授被聘爲中心主任

  自然語言處理與社會人文計算研究中心

  語言是人類區別於其他動物的根本標誌,沒有語言,人類的思維也就無從談起。自然語言處理旨在讓計算機掌握理解與處理人類語言的能力,體現了人工智能的最高任務與境界,只有當計算機具有處理語言的能力時,機器纔可能通過圖靈測試。大連正規×××醫院 mobile.39552222.net

  自然語言處理與社會人文計算研究中心將緊密圍繞人類語言所體現的人類智能本質,重點研究魯棒、可解釋的自然語言處理方法與技術,深入探索語言理解與生成技術在社會人文計算領域的應用,努力建設以中文爲核心、覆蓋多種語言、從詞法到篇章的全流程自然語言處理技術框架與計算平臺,力爭產出以智能創作、智能語言學習、智能教育、智能司法爲代表的、具有國際學術影響力、重大民生意義的社會人文計算研究成果。

  中心的前身是清華大學計算機系自然語言處理課題組,早在上個世紀七十年代末就在黃昌寧教授的帶領下從事自然語言處理研究工作,是國內開展相關研究最早、深具影響力的科研單位,同時也是中國中文信息學會(全國一級學會)計算語言學專業委員會的掛靠單位,孫茂松教授現任該專業委員會的主任。

  

清華大學自然語言處理與社會人文計算研究中心成立!


  中心成立儀式合影

  主要研究方向

  面向多粒度語言單元的統一語義表示框架;

  從詞法到篇章的全流程自然語言處理技術體系;

  數據與知識融合的多語言機器翻譯技術;

  知識指導的自然語言深度理解與智能推理技術;

  跨模態自然語言學習與處理結束

  以自然語言處理爲主要支撐手段的社會人文計算,包括智能創作、智能語言學習、智能教育、智能司法、智能傳播、智能音樂等。

  代表性成果

  1.THUMT—數據驅動的機器翻譯(已開源)

  劉洋副教授向我們介紹了該開源成果 THUMT——它是一個是一個基於深度學習的機器翻譯系統。該系統使用了數據驅動的機器翻譯技術,具備良好的語言無關性,在具備訓練數據的條件下可以迅速爲新語種部署系統。支持漢語、英語、日語、俄語、西班牙語、葡萄牙語、德語、法語、阿拉伯語、維吾爾語等關鍵語言的機器翻譯系統,應用於外交部、新疆公檢法等政府重要部門和搜狗、百度、捷通華聲等互聯網企業,在大規模多語言信息深度分析處理和高效服務方面做出貢獻,相關產品廣泛應用於互聯網、金融、能源、電信、交通等行業領域。

  本次開源成果公佈了在 TensorFlow 平臺上開發的新版本,採用了主流的 Transformer 模型,集成了目前最新的神經機器翻譯技術,具有訓練速度快(支持多機多卡並行)、顯存佔用低(支持單精度浮點數計算)、翻譯性能高(與國際機器翻譯開源軟件相比位居前列)、易於可視化分析(支持層級相關反饋算法)等優點。此外還開放了 70 萬句對的句級對齊漢英平行語料庫和 4 萬句對的詞級對齊漢英平行語料庫。

  2.THUAIPoet—基於深度學習的中文詩歌自動生成系統(已開源)

  矣曉沅博士生(清華大學特等獎金獲得者,獲「中國網事,感動 2018」第三季度網絡感動人物)介紹了開源成果 THUAIPoet。

  THUAIPoet(九歌)是一個基於深度學習神經網絡技術的中文詩歌自動生成系統,支持集句詩、絕句、藏頭詩、詞等不同體裁詩歌的在線生成。曾參加過中央電視臺 CCTV-1《機智過人》節目,與人類詩人同臺競技,取得了幾乎可與人媲美的效果。

  此次成果發佈開源了系統中的無監督風格詩歌生成模型 StylisticPoetry 源碼(相關論文發表於 EMNLP 2018),能夠在無標註數據集上進行任意數量的風格解耦控制。此外還發布兩個人工標註的詩歌數據集(詩歌質量數據集和詩歌情緒數據集),以及國內外詩歌生成相關的主要論文列表。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章