盛大哼唱檢索前端提取算法分析

 

盛大開源頭算法

https://github.com/owensss/sdhumming

兩隻老虎的片段

pitch提取, 求diff ,插值等

 

五點均值化

 

後處理 resample

去除很小接近0的的,都給磨平

除去毛刺

降1/5採樣率

取log2

去除slience地方vad

卡限 6.35 到 8 算下來是  81.5719 到  256hz

轉化成音符

根據算法,一個音符持續長度單位是 10ms*5  = 50ms

 

簡譜和音符,中音的Dao,是C4

7相當於7*50ms = 350ms

 

使用midi工具

https://github.com/kts/matlab-midi/tree/master/src

生成midi

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章