python 5-2 如何處理二進制文件open(“test.wav”,”rb”)/struct.pack/unpack/array(‘h’,(0 for _ in xrange(n)))
解決方案:
open函數以二進制模式打開,指定mode 參數爲 'b'
二進制數據可以通過readinto,讀入到提前分配好的buffer中,便於數據處理,
buffer=array.array('i',(0 for _x in xrange(n)) 申請一片連續的爲0的空間,數據類型是短整型
buffer.tofile(open("testNew.wav",'wb') 可以直接寫入到二進制文件
解析二進制數據可以通過標準庫中的struct模塊的unpack方法
fr=open("test.wav",'rb')
info=fr.read()
struct.unpack("h",info[22:24])
處理
使用struct.unpack可以將二進制解開
import array
array('c','I love china') 這個是字符 第一個參數表示的哪種數據類型
buf=array('i','33') 是short 整型 數據類型
buf.tofile(open('test.txt','wb') 數組可以直接輸出到文件
>>> help(struct.unpack)
Help on built-in function unpack in module _struct:
unpack(...)
Unpack the string containing packed C structure data, according to fmt.
Requires len(string) == calcsize(fmt).
>>>
>>> struct.unpack('h','\x01\x02')小字節序
(513,)
>>> struct.unpack('>h','\x01\x02') 大字節序
(258,)
>>>
FORMAT C TYPE PYTHON TYPE STANDARD SIZE NOTES
x pad byte no value
c char string of length 1 1
b signed char integer 1 (3)
B unsigned char integer 1 (3)
? _Bool bool 1 (1)
h short integer 2 (3)
H unsigned short integer 2 (3)
i int integer 4 (3)
I unsigned int integer 4 (3)
l long integer 4 (3)
L unsigned long integer 4 (3)
q long long integer 8 (2), (3)
Q unsigned long long integer 8 (2), (3)
f float float 4 (4)
d double float 8 (4)
s char[] string
p char[] string
P void * integer (5), (3)
分析二進制的文件 一般都需要用到seek 來定位文件的位置
f.seek(0,2) ==>將文件指針讀到文件結尾
f.tell() ==>告訴當前文件位置
import struct
import array
f=open('test.wav','rb')
info=f.read(44)
print struct.unpack('h',info[22:24]) #(2,)
print struct.unpack('i',info[24:28]) #(44100,)
f.seek(0,2) #
print "total num is %d",f.tell() #報告文件位置
n=(f.tell()-44)/2 #讀出文件除去文件頭的內容
buf=array.array('h',(0 for _ in xrange(n)))
f.seek(44)
f.readinto(buf)
for i in xrange(n):
buf[i] /=8
fw=open('demo.wav','wb')
fw.write(info)
buf.tofile(fw)
fw.close()