論文翻譯-通過無監督方法產生不同風格的唐詩

1、摘要

原論文 Stylistic Chinese Poetry Generation via Unsupervised Style Disentanglement

鏈接: http://nlp.csai.tsinghua.edu.cn/~yangcheng/publications/emnlp2018.pdf

中國人在寫詩歌時主要關注詩歌的意境,在不同的意境下,人們可以創作出不同風格的詩歌。這是人類創作詩歌的重要特徵。以往關於中國詩歌自動生成的研究,大多集中在提高詩詞每一行之間的連貫性上。也有一些人工智能的研究工作專注在詩詞的風格轉換上。但由於要對原始語料做非常的多的標註工作,使得這樣的研究並沒有什麼實質性的進展。本文將着重討論以無監督的方式來實現不同風格的詩詞的生成。本文提出了一種新的模型,該模型將信息論的互信息技術引入到建模當中,從而避免了非常繁瑣的人工標註工作。實驗表明,該模型在保證詩歌一致性與連貫性的情況下,產生不同風格的詩詞。

2、介紹

古詩是中國文學中非常重要的一個組成部分。其中最爲流行的就是五言絕句與七言絕句,這種詩體對文字的數量,韻律,以及平仄都有非常嚴格的要求。在詩歌發展的近千年的時間中,出現了各種風格的詩詞如:田園風格,敘事風格,浪漫主義風格等。而且每一種風格都有著名的代表詩人。在詩歌的創作過程中,即便我們約定了詩詞的關鍵詞以及詩詞的第一句,不同的詩人也能寫出不同風格詩詞。如下圖所示,我們決定關鍵詞是 “月”,同樣會有各種各樣風格的詩詞被創作出來。

詩歌的自動生成是人工智能在寫作領域最早的一次嘗試。同樣,中國古詩的自動生成也被越來越多的學者所關注。最早的詩歌生成是基於規則以及模板形式的,而目前的詩歌生成是基於神經網絡與seq2seq模型的。而這種生成模式更多關注詩歌生成的一致性與連續性。與之前的研究不同。本文將着重研究在相同輸入下,如何產生不同風格的詩歌。這樣的生成模型在詩歌生成方面更具有表現力,更接近人類創作的效果。

但是,在成千上萬的詩句中,並沒有明確的關於風格的標註。在沒有人工標註數據訓練的情況下,傳統的監督模型就沒有辦法得到良好的效果。在所有的研究當中,本文是第一次提出以無監督的模型來生成不同風格的詩詞。

在本文中,我們提出了一種新的模型,該模型可以自動識別詩詞的分類。並在給定關鍵詞的情況下,生成不同風格的詩句。我們採用具有注意力機制的sequence-to-sequence模型作爲模型的主體結構,通過模型最大化兩個隨機變量的互信息。以保證確定的輸入風格與輸出風格的一致性。實驗表明,該模型在保證詩歌一致性與連貫性的情況下,產生不同風格的詩詞。

本文的價值可以總結爲以下三點:

  • 本論文是最先以無監督的方式來生成不同風格的詩歌
  • 在這種無監督的模型中,我們創新性的將戶信息引入到模型當中並作爲一個關鍵變量
  • 實驗表明,該模型在保證詩歌一致性與連貫性的情況下,產生不同風格的詩詞

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章