原创 One-shot VC by Separating Speaker and Content Representations with Instance Normalization閱讀

會議:2019 interspeech 單位:國立臺灣大學 作者:Ju-chieh Chou, Hung-yi Lee 過往有許多關於音色轉換的研究主要集中在並行語料集的基礎上的,已經能夠實現將一種的音色轉換成其多種其他人音色(例如訊飛留

原创 KL散度 L2正則 粗略理解

信息熵可以表達數據的信息量大小; 相對熵,又被稱爲KL散度或信息散度,是兩個概率分佈間差異的非對稱性度量 在信息論中,相對熵等價於兩個概率分佈的信息熵的差值,若其中一個概率分佈爲真實分佈,另一個爲理論(擬合)分佈,則此時相對熵等於交叉熵

原创 語音數據集整理

語音數據集整理 目錄 1.Mozilla Common Voice. 2 2.翻譯和口語音頻的大型數據庫Tatoeba. 2 3.VOiCES Dataset 3 4. LibriSpeech. 4 5.2000 HUB5 English

原创 數據庫複習補充點

一、除法運算: 1.定義: 過程理解:首先在被除數的大集合中找到我們需要的屬性(除數中存在的)   2.第二個角度: 設關係R除以關係S的結果爲關係T,則T包含所有在R但不在S中的屬性及其值,且T的元組與S的元組的所有組合都在R中。

原创 NLP期刊會議

自然語言處理(natural language processing,NLP)在很大程度上與計算語言學(computational linguistics,CL)重合。NLP/CL有一個屬於自己的最權威的國際專業學會,叫做The Asso

原创 感受野 ConvBank

ConvBank,用於擴大感受野,抓取長時信息   感受野是卷積神經網絡裏面最重要的概念之一,爲了更好地理解卷積神經網絡結構,甚至自己設計卷積神經網絡,對於感受野的理解必不可少。   感受野被定義爲卷積神經網絡特徵所能看到輸入圖像的區域,

原创 ubuntu卡頓以及更新源的一些問題

電腦裝了雙系統後特別卡 問題:Ubuntu默認安裝核顯,而不是獨顯 電腦帶有英偉達獨顯,所以需要安裝英偉達的顯卡驅動。 詳見:https://blog.csdn.net/tjuyanming/article/details/8086229

原创 自然語言處理期刊會議2

列一下自然語言處理(NLP)這個小方向的: 會議(C): ACL (Annual Meeting of the Association for Computational Linguistics) NAACL (Annual Confer

原创 word2vec基本原理和實現

Word2Vec   目錄 一.概述... 1 CBow模型 (Continuous Bag-of-Words Model) 2 Skip-gram模型... 2 Hierarchical Softmax. 3 Negative Samp

原创 linux禁用nouveau安裝nvidia驅動遇到的問題

1.禁用nouveau 安裝nvidia顯卡驅動首先需要禁用nouveau,不然會碰到衝突的問題,導致無法安裝nvidia顯卡驅動。 編輯文件blacklist.conf   sudo vim /etc/modprobe.d/blac

原创 VAE粗略理解

AE 自編碼是一種表示學習的技術,是deep learning的核心問題 讓輸入等於輸出,取中間的一層作爲embedding, 即編碼 對中間的隱層進行約束,就可以得到不同類型的編碼 h<x,這就是普通的降維編碼 h>x, 並且約束其稀疏