原创 基於深度學習的知識圖譜構建(簡要綜述)

1  簡介        信息技術的發展不斷推動着互聯網技術的變革,Web技術作爲互聯網時的標誌性技術,正處於這場技術變的核心。從網頁的鏈接到數據的鏈接,Web技術正在逐步朝向Web之父Berners-Lee設想中的語義網絡演變。語義網絡

原创 MFCC算法的實現過程(原理篇)

       前期的博客中,已經貼出了MFCC算法的C++代碼實現。本篇文章,主要講解該算法的數學原理。        聲音是因爲物體振動而產生的聲波,是可以被人或動物的聽覺器官所感知的波動現象。聲音有多種特性,比如音色、音調、響度、頻率

原创 博士申請——Research Proposal

       之前在申請境外博士的時候,寫過一篇RP(研究計劃書)。由於不是碩士的研究方向,所以寫的比較淺顯。在這裏貼出來,供大家參閱,對於某些童鞋,或許會有所幫助。                                    

原创 關於ELMo、Transformer及Bert的部分疑難問題解答

ELMo其實是考慮了目標信息的前後內容,來對目標進行預測:使用深層Bi-RNN對序列進行學習,可以學習到目標的前後文信息,以此來更好的表示目標數據。ELMo將目標數據的每層的前後文信息進行串接,並對多層的串接結果進行加權求和(權值是學習的

原创 Z字形遍歷二叉樹

常見的二叉樹遍歷,有層次遍歷、前序遍歷、中序遍歷、後序遍歷。其中層次遍歷中最常見的是正序層次遍歷,但也會出現Z字形遍歷的情況:如果從左向右輸出第n行,則下一行從右向左輸出。正序層次遍歷是利用隊列的先到先得性質,很明顯Z字形遍歷要用到棧得性

原创 C++語言實現堆排序

堆排序也是一種較爲簡單和常用的排序方式,其在面試和工程實踐中常被提及。具體的理論知識在嚴蔚敏、吳偉民版《數據結構》課本上非常清晰。這裏,僅展示其C++語言實現。 void HeapAjust(int a[],int cur,int ta

原创 支持向量機與核函數

(1)支持向量機是通過引入特徵變換來將原空間的非線性問題轉化爲新空間中的線性問題。 (2)在前面的博文中,我們得到結論,支持向量機的決策規則爲:                                              

原创 深度學習中的部分常見問題

(1)爲什麼算法有時候會陷入局部最優? 通常情況下,目標函數是權值的複雜的非線性函數,往往存在多個局部極小點。梯度下降法如果收斂到一個局部極小值點,梯度就等於或接近於0,無法進一步改進目標函數,導致學習過程無法收斂到全局最優解。 (2)如

原创 MFCC算法的實現過程(代碼篇)

MFCC的核心部分主要是: 1)預加重:爲了消除發聲過程中,聲帶和嘴脣造成的效應,來補償語音信號受到發音系統所壓抑的高頻部分。並且能突顯高頻的共振峯。 簡單理解就是在頻域上面都乘以一個係數,這個係數跟頻率成正相關,所以高頻的幅值會有所提升

原创 C++語言實現歸併排序

歸併排序的表現形式有多種,最常見的當然是遞歸歸併排序,這裏不再贅述。我們主要來實現兩種不常用的歸併排序形式:非遞歸歸併排序和原地歸併排序。 非遞歸歸併排序 void Merge(int num[], int size)//size表示長

原创 基於深度學習的依存句法分析

        依存句法分析,對於下游的很多任務(如分詞、詞性標註、命名實體識別、組塊分析等)非常重要。傳統的句法分析,主要包括兩種方法:基於圖模型的依存句法分析(Graph-based)和基於轉移的依存句法分析(Transition-b

原创 Word2Vec訓練過程中的加速問題

       學習ML/NLP的童鞋們都知道,word2vec是NLP的一個重要應用。Word2Vec是谷歌開源的一個將語言中字詞轉化爲向量形式表達的工具。它通過在大數據量上進行高效訓練而得到詞向量,使用詞向量可以很好地度量詞與詞之間的相

原创 二叉樹的子結構問題

這個問題,在很多面試當中會出現。所謂子結構,就是子樹結構是樹結構的一部分。我們可以使用遞歸的方法來進行相應的處理與判斷。 //樹的子結構 struct tree { int value; tree *left;

原创 支持向量機(二)

  之前的博文中,我們討論了線性支持向量機。這裏,我們討論非線性的情況。 (1)樣本集線性不可分,是說對於樣本集,其中,不等式不可能被所有樣本同時滿足。 (2)當(1)中的問題存在時,即稱爲非線性可分。我們總可以在不等式的左側加上一個正數

原创 反轉0,但應該使得到的1數量最大

該題目是在線筆試時遇到的。題目的正式描述爲:給定一個全部由0和1組成的字符串,並可以把0變換成1,但變換的次數最多爲sec次,求經過變換後連續1的最大個數。 #include<iostream> #include<string.h> u