wav和pcm是語音信號處理中最常見的文件格式,時常會遇到需要兩種文件格式的相互轉換。wav存儲的一般是解碼後爲[-1, 1]的float數據,文件頭有44個字節記錄文件的採樣率、長度等等信息。pcm存儲的是int型整數,不含任何採樣率相關信息。雖然原理比較簡單,但是整理後更便於利用。
wav轉pcm
原理:將文件頭去掉,數據轉成int型即可。
import numpy as np
def wav2pcm(wavfile, pcmfile, data_type=np.int16):
f = open(wavfile, "rb")
f.seek(0)
f.read(44)
data = np.fromfile(f, dtype= data_type)
data.tofile(pcmfile)
pcm轉wav
原理:利用wave庫,添加通道信息、採樣位數、採樣率等信息作爲文件頭,pcm數據直接寫入即可。
import wave
def pcm2wav(pcm_file, wav_file, channels=1, bits=16, sample_rate=16000):
pcmf = open(pcm_file, 'rb')
pcmdata = pcmf.read()
pcmf.close()
if bits % 8 != 0:
raise ValueError("bits % 8 must == 0. now bits:" + str(bits))
wavfile = wave.open(wav_file, 'wb')
wavfile.setnchannels(channels)
wavfile.setsampwidth(bits // 8)
wavfile.setframerate(sample_rate)
wavfile.writeframes(pcmdata)
wavfile.close()