原创 dot圖-有限狀態機

dot圖的規則跟語法,先來看一個最簡單的例子。 digraph g { label=test 深圳 -> 南山 [ label = "process"] 南山 -> 科技園 南山 -> 金融公司 { rank=same

原创 python多線程互斥鎖問題

之前一直覺得python的多線程有點問題,今天搞了一下多線程的事情;直接上代碼了。 #-*- coding:utf8 -*- #!/usr/bin/env python import os import sys import s

原创 python的string類型與dictionary

將字符串轉爲dictionary data_str = ''' {'start_time': '0', 'end_time': '70', 'text': '明天天氣'} ''' 對於上面的字符串,可以直接用 info_map

原创 最大似然估計

現在簡單寫寫最大似然估計。 最大似然估計是一個概率估計問題,譬如已知一個數據空間XXX,數據XXX中的每一個樣本都有n爲特徵。有樣本整體x=[x1,x2,x3,x4,.....,xn]x=[x_1,x_2,x_3,x_4,....

原创 高斯混合模型

高斯混合模型,首先說的那就是高斯分佈, f(x)=12πσexp⁡(−(x−μ)22σ2)=N(x,σ,μ2) f(x)=\frac{1}{\sqrt{{2\pi}}\sigma}\exp(-\frac{(x-\mu)^2}{2\

原创 python中文單字問題

一直都有這個問題的說,或許其實並沒有自己想象的那麼難處理的說; 對應的python2 python3都有相應的解決辦法。 已知有文件 明天天氣 現在需要進行單字切分,得到文件 明 天 天 氣 python2 與 python3

原创 fst-graph

這裏就直接貼上代碼了。 digraph G { node [shape = circle] 0 -> 1 [ label = sil ] 0 -> 2 [ label = w ] 1 -> 1 [ label =

原创 c++一次性讀取文件

c++中一次讀取整個文件的內容的方法: 讀取至char*的情況 std::ifstream t; int length; t.open("file.txt"); // open input file t.se

原创 構圖邏輯

現在寫寫一般的構圖邏輯,這裏會介紹ci-phone的,同時也會介紹cd-phone的構圖邏輯。 一般介紹 ci-phone構圖 cd-phone構圖 下面先介紹下技術背景,主要應用在解碼過程中,也就是語音識別;譬如喚醒、命令詞

原创 語音識別-先驗概率後驗概率似然函數

這裏貼一個網頁: https://www.cnblogs.com/wjgaas/p/4523779.html 簡單的說: Posterior probability ∝ Likelihood × Prior probability

原创 語音識別Topo筆記

這裏記錄一下語音識別中的拓撲的問題。 三因子狀態的topo Chain-model的topo Ctc的topo 三因子狀態的topo <Topology> <TopologyEntry> <ForPhones> 1 2 3 4

原创 語音識別--gmm-hmm思考

簡單回顧一下今天所看的內容: gmm-hmm pdf: 概率密度函數,在這裏可以由gmm來估計,同樣也可以用dnn來估計。 gmm: 高斯混合模型,單高斯函數,多高斯函數。 能擬合任何函數,這裏會涉及到均值方差等變量 語音有短時

原创 字符串反轉

將字符串反轉 簡單的將字符串反轉一下,如有“hello”,將前面三個字符串移到後面,那麼結果是”lohel”,用代碼實現。 現在直接上代碼了,兩種實現方式。 #include <iostream> #include <cstdl

原创 字符串包含問題

問題描述:兩個字符串,str1 = “abcde”, str2 = “cba”; 那麼str2中的所有字符都在str1中出現,那麼就是包含關係,否則爲非包含關係。 以下爲代碼: #include <iostream> #incl

原创 最長迴文子串-簡單版本

今兒寫一個小代碼,正如題目所寫的,最長迴文子串,感覺不難。 #include <iostream> #include <cstring> #include <cstdlib> using namespace std; const