原创 視頻 Speech Recognition(ASR)

https://www.youtube.com/watch?v=HyUtT_z-cms&t=53s 1.speech recognition Acounstic respresentation Phonetic representa

原创 leetcode64.最小路徑和

題目: 給定一個包含非負整數的 m x n 網格,請找出一條從左上角到右下角的路徑,使得路徑上的數字總和爲最小。 說明:每次只能向下或者向右移動一步。 示例: 輸入: [ [1,3,1], [1,5,1], [4,2,1] ] 輸出

原创 leetcode401.二進制手錶

題目: 二進制手錶頂部有 4 個 LED 代表小時(0-11),底部的 6 個 LED 代表分鐘(0-59)。 每個 LED 代表一個 0 或 1,最低位在右側。 例如,上面的二進制手錶讀取 “3:25”。 給定一個非負整數 n

原创 leetcode40.組合總和 II

題目: 給定一個數組 candidates 和一個目標數 target ,找出 candidates 中所有可以使數字和爲 target 的組合。 candidates 中的每個數字在每個組合中只能使用一次。 說明: 所有數字(包括

原创 leetcode279.完全平方數

題目: 給定正整數 n,找到若干個完全平方數(比如 1, 4, 9, 16, …)使得它們的和等於 n。你需要讓組成和的完全平方數的個數最少。 示例: 示例 1: 輸入: n = 12 輸出: 3 解釋: 12 = 4 + 4 +

原创 leetcode120.三角形最小路徑和

題目: 給定一個三角形,找出自頂向下的最小路徑和。每一步只能移動到下一行中相鄰的結點上。 示例: 例如,給定三角形: [ [2], [3,4], [6,5,7], [4,1,8,3] ] 自頂向下的最小路徑和爲 11(即,2 + 3

原创 leetcode343.整數拆分

題目: 給定一個正整數 n,將其拆分爲至少兩個正整數的和,並使這些整數的乘積最大化。 返回你可以獲得的最大乘積。 示例: 示例 1: 輸入: 2 輸出: 1 解釋: 2 = 1 + 1, 1 × 1 = 1。 示例 2: 輸入: 1

原创 語音與語言處理筆記——10語音識別

multipass decoding:N-Best lists and lattices A stack decoding context-dependent acounstic models:三音素 discriminative

原创 leetcode93.復原IP地址

題目: 示例: 思路: 代碼:

原创 leetcode17.電話號碼的字母組合

題目: 給定一個僅包含數字 2-9 的字符串,返回所有它能表示的字母組合。 給出數字到字母的映射如下(與電話按鍵相同)。注意 1 不對應任何字母。 示例: 輸入:“23” 輸出:[“ad”, “ae”, “af”, “bd”, “

原创 GMM

單變量高斯分佈 均值,方差 多元變量高斯分佈 均值,協方差矩陣 單變量混合高斯分佈 多元變量混合高斯分佈 混合成分M的數量是一個先驗值,主流做法是直接選取。 語音識別中,輸入向量x的維度很大時,用對角協方差矩陣代替全協

原创 leetcode131.分割回文串

題目: 示例: 思路: 代碼:

原创 語音識別

vad pitch mfcc Fbank plp cmvn LDA HLDA(異方差線性判別分析) MLLT FMLLR VTLN GMM HMM(前向後向概率) EM GMM參數估計 GMM-HMM模型 Baum-Welch算法(

原创 HMM(前向後向概率)

隱馬爾科夫模型參數(三要素): 初始狀態概率 轉移概率 觀測概率 兩個基本假設: 齊次馬爾可夫假設:HMM任一時刻t某一狀態只依賴於其前一時刻的狀態,與其它時刻的狀態及觀察無關,也即時刻t無關。 觀測獨立性假設:任一時刻的觀測只

原创 語音識別實踐——深度學習訓練準則

DNN的模型參數{W,b}需要通過每個任務的訓練樣本S={o,y}來訓練得到。這個過程即訓練過程或者參數估計過程,需要一個給定的訓練準則和學習算法,也即需要定義一個損失函數。實際訓練中交叉熵準則應用最多。 模型參數的訓練應該最小化期望