Python語音基礎操作--6.2LPC編碼

原創

2020-06-16 09:06

《語音信號處理試驗教程》（梁瑞宇等）的代碼主要是Matlab實現的，現在Python比較熱門，所以把這個項目大部分內容寫成了Python實現，大部分是手動寫的。使用CSDN博客查看幫助文件：

代碼可在Github上下載：busyyang/python_sound_open

線性預測編碼(linear predictive coding， LPC) 是運用於音頻信號處理與語音處理的壓縮編碼方式，根據線性預測模型的信息表示數字語音信號譜包絡。它是最有效的語音分析技術之一，也是低位速高質量語音編碼的最有用的方法之一，能夠提供非常精確的語音參數預測。線性預測編碼通過估計共振峯剔除它們在語音信號中的作用，估計保留的蜂鳴音強度與頻率來分析語音信號;同時，使用蜂嗚參數與殘餘信號生成源信號，使用共振峯生成表示聲道的濾波器，源、信號經過濾坡器的處理來逆向合成語音信號。由於語音信號隨着時間變化這個過程是在一段段的語音信號幀上進行處理的，通常每秒30-50幀就能對可理解的信號進行很好的壓縮。

線性預測編碼通常用於語音的重新合成，它是電話公司使用的聲音壓縮格式，如GSM標準就在使用LPC編碼格式。它還用作安全無線通信中的格式，在安全的無線通信中，聲音必須進行數字化、加密然後通過狹窄的語音信道傳輸。

線性預測分析的基本思想是:由於語音樣點之間存在相關性，所以可以用過去的樣點值來預測現在或將來的樣點值，即一個語音抽樣可以用過去若干個語音抽樣或它們的線性組合來逼近。通過使實現語音抽樣與線性預測抽樣之間的誤差在某個準則(通常爲最小均方誤差準則)下達到最小值來決定一組預測係數。這一組預測係數就反映了語音信號的特性，可以作爲語音信號的特徵參數用於語音合成和語音識別等。

線性預測分析的基本假設是認爲語音信號是一個激勵信號通過一個濾波器得到的。採樣點的輸出 $s(n)$ 可以用前p個樣本的線性組合來表示：
$\hat s(n)=\sum^p a_is(n-i)$

通過 $E(n)=s(n)-\hat s(n)$ 最小來求解。LPC參數是模擬人的發聲器官，是基於語音合成的模型參數，每個聲管對應一個LPC模型的極點，一般情況下，極點個數爲12~16之間，就可以足夠清晰地描述語音信號的特徵，選擇p=12可以對絕大多數語音信號的聲道模型取得足夠的近似，增大p可以改善近似效果，但是計算量變大。

from scipy.signal import filtfilt

from chapter2_基礎.soundBase import *
from chapter3_分析實驗.lpc import lpc_coeff

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

data, fs = soundBase('C6_1_y.wav').audioread()
N = len(data)
time = [i / fs for i in range(N)]  # 設置時間
p = 12
ar, g = lpc_coeff(data, p)
ar[0] = 0
est_x = filtfilt(-ar, [1], data)

plt.subplot(2, 1, 1)
plt.plot(time, data, 'k')
plt.plot(time, est_x, 'c')
plt.title('LPC解碼')
plt.legend(['信號', '解碼信號'])
plt.subplot(2, 1, 2)
plt.plot(est_x - data)
plt.title('誤差')
plt.savefig('LPC解碼.png')
plt.close()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python語音基礎操作--6.2LPC編碼

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

sm4加密工具類

Python語音基礎操作--10.2隱馬爾科夫模型的孤立字識別

Python語音基礎操作--5.1自適應濾波

Python語音基礎操作--12.2基於神經網絡的情感識別

Python語音基礎操作--7.2LPC的語音合成

Python語音基礎操作--7.1幀合併

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結