原创 Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations

Improved Zero-shot Neural Machine Translation via Ignoring Spurious Correlations技術點摘要引言Degeneracy Issue of Zero-sho

原创 ubuntu系統下安裝tensotflow、pytorch

安裝tensotflow、pytorch更改下載源:(國外的服務器下載很慢)安裝CUDA9.0安裝cuDNN v7.0安裝Anaconda卸載anaconda打開Jupyter Notebook:Anaconda虛擬環境安裝ter

原创 平行句挖掘Unsupervised Parallel Sentence Extraction with Parallel Segment......

Unsupervised Parallel Sentence Extraction with Parallel SegmentDetection Helps Machine Translation論文點摘要 這是2019ACL德國

原创 Revisiting Adversarial Autoencoder for Unsupervised Word Translation with Cycle Consistency and...

2019NAACL的一篇文章,個人覺得很好的一篇文章,將去噪自編碼器和回譯應用到詞對齊的過程中,應用比較靈活。 文章鏈接: Revisiting Adversarial Autoencoder for Unsupervised W

原创 linux常用命令

linux常用命令其他編輯文件終端目錄操作(路徑)刪除壓縮文件操作移動/重命名 文件運行sh文件進程常見錯誤 linux命令多而雜,很多命令使用的時候都需要百度才能找到,下面是我常用的一些命令,總結起來就不用到處去找了。 其他 s

原创 Extract and Edit: An Alternative to Back-Translation for Unsupervised Neural Machine Translation

Extract and Edit: An Alternative to Back- Translation for Unsupervised Neural Machine Translation知識點摘要引言背景Extract-E

原创 Improving Unsupervised Word-by-Word Translation with Language Model and Denoising Autoencoder

Improving Unsupervised Word-by-Word Translation with Language Model and Denoising Autoencoder知識點摘要引言Cross-lingual W

原创 Artetxe - 弱監督雙語詞嵌入學習Learning bilingual word embeddings with (almost) no bilingual data

@[TOC](Learning bilingual word embeddings with (almost) no bilingual data) 這是2017ACL的一篇文章。這是一種弱監督的方法,使用了少量的平行語料來學習雙

原创 用word2vec和fastText來生成word embedding

1. word2vec 原文鏈接: Distributed Representations of Words and Phrases and their Compositionality 首先我們要知道Word2Vec包含了兩

原创 集束搜索(beam search)和貪心搜索(greedy search)

最近讀論文的時候看到文中經常用到集束搜索(beam search),可能很多人不懂這到底是個什麼算法,其實很簡單,順便把貪心搜索(greedy search)也介紹一下。 貪心搜索(greedy search) 貪心搜索最爲簡單,