畫出wav文件聲音數據的波形曲線

by Touzani

        WAV文件格式

波形音頻文件(*.WAV)是Microsoft爲Windows設計的多媒體文件格式RIFF(The Resource Interchange File Format,資源交換文件格式)中的一種(另一種常用的爲AVI)。RIFF由文件頭、數據類型標識及若干塊(chunk)組成。
 
WAV文件的基本格式
內容
變量名
大小
取值
RIFF
文件標識符串
fileId
4B
“RIFF”
頭後文件長度
fileLen
4B
非負整數(=文件長度-8)
數據類型標識符
波形文件標識符
waveId
4B
“WAVE”
格式塊
塊頭
格式塊標識符串
chkId
4B

“fmt ”

頭後塊長度
chkLen
4B
非負整數(= 16或18)
塊數據
格式標記
wFormatTag
2B
非負短整數(PCM=1)
聲道數
wChannels
2B
非負短整數(= 1或2)
採樣率
dwSampleRate
4B
非負整數(單聲道採樣數/秒)
平均字節率
dwAvgBytesRate
4B
非負整數(字節數/秒)
數據塊對齊
wBlockAlign
2B
非負短整數(不足補零)
採樣位數
wBitsPerSample
2B
非負短整數(PCM時纔有)
擴展域大小
wExtSize
2B
非負短整數
可選(根據chkLen=16 or 18判斷)
擴展域
extraInfo

extSize B

擴展信息
數據塊
塊頭
數據塊標識符串
chkId
4B

“data”

頭後塊長度
chkLen
4B
非負整數
塊數據
波形採樣數據
x或xl、xr

chkLen B

左右聲道樣本交叉排列
樣本值爲整數(整字節存儲,不足位補零)
整個數據塊按blockAlign對齊
 
注意:

       wFormatTag = 1時爲無壓縮的PCMPulse Code Modulation, 脈衝編碼調製)標準格式(即等間隔採樣、線性量化)。

      單字節樣本值v爲無符號整數(0~255),實際樣本值應爲v-128;多字節樣本值本身就是有符號的,可直接使用。

有些wav文件在data塊之前,fmt塊之後還有一個fact..

|  ID    |  4 Bytes |   'fact'          |
        ----------------------------------
      | Size  |  4 Bytes |  
數值爲4    |
       ----------------------------------
      | data  |  4 Bytes |  ?? ?? ?? ??  | 

因此要根據讀到的ID進行判斷

參考: http://www.snowcn.net/?action/viewspace/itemid/260.html  wav文件格式分析詳解


Wav文件 有數值表示均爲低字節表示低位,高字節表示高位。

通過CArchive>>讀入, 會自動轉化(把高字節的作爲高位)

如讀入地址爲0000000的雙字(DWORD)到變量dw :

0000000: 52 49 46 46 

dw會等於0x46464952

 


爲了簡化RIFF文件中的4字符標識的讀寫與比較,Windows SDK在多媒體頭文件mmsystem.h中定義了類型
FOURCCFour-Character Code四字符代碼):

typedef DWORD FOURCC;

及其構造宏(用於將4個字符轉換成一個FOURCC數據)

FOURCC mmioFOURCC(CHAR ch0, CHAR ch1, CHAR ch2, CHAR ch3);

其定義爲MAKEFOURCC宏:

#define  mmioFOURCC(ch0, ch1, ch2, ch3)  MAKEFOURCC(ch0, ch1, ch2, ch3);

MAKEFOURCC宏定義爲:

#define MAKEFOURCC(ch0, ch1, ch2, ch3)  /

    ((DWORD)(BYTE)(ch0) | ((DWORD)(BYTE)(ch1) << 8) |  /

    ((DWORD)(BYTE)(ch2) << 16) | ((DWORD)(BYTE)(ch3) << 24 ));

例如:

#include <mmsystem.h>

#define ID_RIFF    mmioFOURCC('R', 'I', 'F', 'F')

#define ID_WAVE   mmioFOURCC('W', 'A', 'V', 'E')

……

FOURCC id;

……

              ar >> id;

              if (id != ID_RIFF) {

       ……

}

……

l         播放波形聲音文件

函數PlaySound可以播放系統聲音、聲音資源和聲音文件,其函數原型爲:

BOOL PlaySound(

  LPCSTR pszSound, 

  HMODULE hmod,    

  DWORD fdwSound

);

例如:

PlaySound(“c://sounds//sample.wav”, NULL, SND_ASYNC);

              PlaySound(ar.GetFile()->GetFilePath(), NULL, SND_ASYNC);

 

下面是完整步驟:

新建MFC應用程序, 單文擋(SDI)項目WavePlayer.

爲了使包含PlaySound的程序能夠編譯通過,必須包含多媒體頭文件: #include <mmsystem.h>, 而且需要注意頭文件包含的次序.. 否則會提示找不到標識符..

並在項目中添加多媒體庫:在項目區中任何頁中選中頂部的項目名,選“項目/屬性”菜單項或按Alt+F7組合鍵,彈出“[項目名]屬性頁”對話框,在該其左上角的“配置”欄的下拉式列表中,選擇“所有配置”項,在其左邊的“配置”目錄欄中,選中“配置屬性/鏈接器/輸入”項,在右邊頂行的“附加依賴項”欄中鍵入winmm.lib,按“確定”鈕關閉對話框。

 

文件過濾

可通過修改資源視圖頁的“項目名/項目名.rc/String Table/String Table”串表資源中的IDIDR_MAINFRAME(SDI)所對應的串,爲應用程序的文件I/O對話框增加文件過濾器。爲WavePlayer程序增加*.wav的過濾器:

將原來的串

IDR_MAINFRAME  “WavePlayer/n/nWavePlayer/n/n/nWavePlayer.Document/nWavePlayer.Document”

修改成

“WavePlayer/n/nWavePlayer/nWave Files (*.wav)/n.wav/nWavePlayer.Document/nWavePlayer.Document”

 

 

文檔類cpp 添加如下宏

#define ID_RIFF mmioFOURCC('R', 'I', 'F', 'F')

#define ID_WAVE mmioFOURCC('W', 'A', 'V', 'E')

#define ID_data mmioFOURCC('d', 'a', 't', 'a')

#define ID_fmt  mmioFOURCC('f', 'm', 't',  '/x20')

#define ID_fact mmioFOURCC('f', 'a', 'c',  't')

 

 

文檔類添加如下變量

public:

    int num;         // 樣本數

    LONG* data;      // 樣本數據

    LONG *Ldata, *Rdata;     // 雙聲道數據

    WORD BytesPerSample, wChannel;     // 一個樣本的字節數,  聲道數

 

Serialize函數添加如下代碼:

if (ar.IsStoring())

    
{

        
// TODO: 在此添加存儲代碼

    }


    
else

    
{

        
// TODO: 在此添加加載代碼

        FOURCC id, chkLen,  dw;    
// 無符號雙字

        BYTE b;               
// 無符號字節

        WORD w;              
// unsined short  無符號單字長

        WORD fmtTag;           
//格式標記

        WORD wBitsPerSample;   
//樣本位數

        FOURCC dwAvgBytesRate;  

        FOURCC Len;          
// 數據塊大小,  BYTE

        ar
>>id;

        
if(id!=ID_RIFF)  return;

        ar
>>dw>>id;

        
if(id!=ID_WAVE) return;

        ar
>>id; if(id!=ID_fmt)  return;

        ar
>>chkLen;            // 16或

        ar
>>fmtTag;            // 只處理PCM(Pulse Code Modulation, 脈衝編碼調製)情況

        
if(fmtTag!=1)

            
return;

        ar
>>wChannel;           //聲道數

        ar
>>dw;                 //採樣率

        ar
>>dwAvgBytesRate;     //平均字節率

        ar
>>w;                  //數據塊對齊

        ar
>>wBitsPerSample;     //樣本位數

        
if(chkLen==18)

        
{

            ar
>>w;               // 擴展域大小

            
for(int i=0; i<w; i++)  // 讀走擴展域的內容

                ar
>>b;

        }


        ar
>>id;            // data or fact

        
if(id==ID_fact)

        
{

            ar
>>dw>>dw;        // 讀走fact塊內容

            ar
>>id;    //      data  ID

        }


        
if(id!=ID_data)

            
return;

        ar
>>Len;          

        BytesPerSample
=wBitsPerSample/8;         // 一個樣本的字節數

        num
=Len/BytesPerSample;              // 樣本數

        
if(wChannel==1)                 // 單音道

        
{

            data
=new LONG[num];

            
if(BytesPerSample==1)

                
for(int i=0; i<num; i++)

                
{

                    ar
>>b;

                    data[i]
=b-128;

                }


            
else if(BytesPerSample==2)

                
for(int i=0; i<num; i++)

                
{

                    ar
>>w;

                    data[i]
= (SHORT)w;         // 無符號數轉成有符號數

                }


            
else if(BytesPerSample==4)

                
for(int i=0; i<num; i++)

                
{

                    ar
>>dw;

                    data[i]
=(LONG)w;          // 無符號數轉成有符號數

                }


            
else if(BytesPerSample==3)

                
for(int i=0; i<num; i++)

                
{

                    ar
>>b>>w;

                    data[i]
=w+b;

                }


        }


        
else if(wChannel==2)             // 雙音道

        
{

            Ldata
=new LONG[num/2];     // 左聲道

            Rdata
=new LONG[num/2];      // 右聲道

            
if(BytesPerSample==1)

            
{

                
for(int i=0; i<num/2; i++)  // 一個聲道的樣本數爲num/2, 左右聲道交替

                
{

                    ar
>>b;            

                    Ldata[i]
=b-128;        

                    ar
>>b;

                    Rdata[i]
=b-128;

                }


            }


            
else if(BytesPerSample==2)

                
for(int i=0; i<num/2; i++)

                
{

                    ar
>>w;

                    Ldata[i]
=(SHORT)w;         // 無符號數轉成有符號數

                    ar
>>w;

                    Rdata[i]
=(SHORT)w;

                }


            
else if(BytesPerSample==4)

                
for(int i=0; i<num/2; i++)

                
{

                    ar
>>dw;

                    Ldata[i]
=(LONG)dw;

                    ar
>>dw;

                    Rdata[i]
=(LONG)dw;

                }


            
else if(BytesPerSample==3)

                
for(int i=0; i<num/2; i++)

                
{

                    ar
>>b>>w;

                    Ldata[i]
=w+b;

                    ar
>>b>>w;

                    Rdata[i]
=w+b;

                }


        }


        PlaySound(ar.GetFile()
->GetFilePath(), NULL, SND_ASYNC);  // 播放聲音

    }


 

 

視圖類OnDraw函數添加如下代碼:

CRect rect;                // 客戶區大小

    GetClientRect(
&rect);        

    CPen gpen(PS_SOLID, 
1, RGB(02500));          // 綠色筆

    pDC
->SelectObject(&gpen);

    
if(pDoc->data!=NULL || pDoc->Ldata!=NULL)        // 數據非空時才畫

    
{

        
float A=pow(2.08.0*pDoc->BytesPerSample-1);  // 將樣本的高度映射到所需高度,

                                                       
// 先算出樣本的最大值

        
if(pDoc->wChannel==1)                         // 單聲道

        
{  

            
int x=0, y=rect.Height()/2;               

            
while(x < rect.Width())         

            
{

                
int min=INT_MAX, max=INT_MAX+1;      // 讓min初始爲最大的int, 讓max初始化最小的int

                
// 一個象素x映射(樣本數/客戶區寬度)個樣本點, 用其中最大最小值, 畫一豎直的線段

                
for(int j=x*pDoc->num/rect.Width(); j<(x+1)*pDoc->num/rect.Width(); j++)

                
{

                    
if(pDoc->data[j]<min)

                        min
=pDoc->data[j];

                    
if(pDoc->data[j]>max)

                        max
=pDoc->data[j];

                }


                pDC
->MoveTo(x, y+(max*rect.Height()/2.0/A));

                pDC
->LineTo(x, y+(min*rect.Height()/2.0/A));

                x
++;

            }


            CPen pen(PS_SOLID, 
1, RGB(20000));          // 客戶區中間畫一橫線

            pDC
->SelectObject(&pen);

            pDC
->MoveTo(0, rect.Height()/2);

            pDC
->LineTo(rect.Width(), rect.Height()/2);    

        }


        
else if(pDoc->wChannel==2)

        
{

            
// 在客戶區上半部分畫左聲道, 原理同單聲道,

            
int x=0, y=rect.Height()/4;

            
while(x<rect.Width())

            
{

                
int min=INT_MAX, max=INT_MAX+1;

                
for(int j=x*pDoc->num/2/rect.Width(); j<(x+1)*pDoc->num/2/rect.Width(); j++)

                
{

                    
if(pDoc->Ldata[j]<min)

                        min
=pDoc->Ldata[j];

                    
if(pDoc->Ldata[j]>max)

                        max
=pDoc->Ldata[j];

                }


                pDC
->MoveTo(x, y+(max*rect.Height()/4.0/A));

                pDC
->LineTo(x, y+(min*rect.Height()/4.0/A));

                x
++;

            }


            
// 在客戶區下半部分畫右聲道

            x
=0, y=3*rect.Height()/4;

            
while(x<rect.Width())

            
{

                
int min=INT_MAX, max=INT_MAX+1;

                
for(int j=x*pDoc->num/2/rect.Width(); j<(x+1)*pDoc->num/2/rect.Width(); j++)

                
{

                    
if(pDoc->Rdata[j]<min)

                        min
=pDoc->Rdata[j];

                    
if(pDoc->Rdata[j]>max)

                        max
=pDoc->Rdata[j];

                }


                gpen.DeleteObject();

                gpen.CreatePen(PS_SOLID, 
1, RGB(25500));

                pDC
->SelectObject(&gpen);

                pDC
->MoveTo(x, y+(max*rect.Height()/4.0/A));

                pDC
->LineTo(x, y+(min*rect.Height()/4.0/A));

                x
++;

            }


            
// 畫客戶區中央橫線

            CPen pen(PS_SOLID, 
1, RGB(000));

            pDC
->SelectObject(&pen);

            pDC
->MoveTo(0, rect.Height()/2);

            pDC
->LineTo(rect.Width(), rect.Height()/2);

 

           

            pen.DeleteObject();

            pen.CreatePen(PS_SOLID, 
1, RGB(00255));

            pDC
->SelectObject(&pen);

            
// 畫左聲道橫線

            pDC
->MoveTo(0, rect.Height()/4);

            pDC
->LineTo(rect.Width(), rect.Height()/4);

            
// 右聲道橫線

            pDC
->MoveTo(03*rect.Height()/4);

            pDC
->LineTo(rect.Width(), 3*rect.Height()/4);

        }


    }

OnDraw用到了pow函數, 添加頭文件包含指令

#include<cmath>      // double pow(double, double);


width="728" scrolling="no" height="90" frameborder="0" align="middle" src="http://download1.csdn.net/down3/20070601/01184120111.htm" marginheight="0" marginwidth="0">
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章