最簡單的視音頻播放示例9:SDL2播放PCM

最簡單的視音頻播放示例系列文章列表:

最簡單的視音頻播放示例1:總述

最簡單的視音頻播放示例2:GDI播放YUV, RGB

最簡單的視音頻播放示例3:Direct3D播放YUV,RGB(通過Surface)

最簡單的視音頻播放示例4:Direct3D播放RGB(通過Texture)

最簡單的視音頻播放示例5:OpenGL播放RGB/YUV

最簡單的視音頻播放示例6:OpenGL播放YUV420P(通過Texture,使用Shader)

最簡單的視音頻播放示例7:SDL2播放RGB/YUV

最簡單的視音頻播放示例8:DirectSound播放PCM

最簡單的視音頻播放示例9:SDL2播放PCM

=====================================================


本文記錄SDL播放音頻的技術。在這裏使用的版本是SDL2。實際上SDL本身並不提供視音頻播放的功能,它只是封裝了視音頻播放的底層API。在Windows平臺下,SDL封裝了Direct3D這類的API用於播放視頻;封裝了DirectSound這類的API用於播放音頻。因爲SDL的編寫目的就是簡化視音頻播放的開發難度,所以使用SDL播放視頻(YUV/RGB)和音頻(PCM)數據非常的容易。


SDL簡介

SDL(Simple DirectMedia Layer)是一套開放源代碼的跨平臺多媒體開發庫,使用C語言寫成。SDL提供了數種控制圖像、聲音、輸出入的函數,讓開發者只要用相同或是相似的代碼就可以開發出跨多個平臺(Linux、Windows、Mac OS X等)的應用軟件。目前SDL多用於開發遊戲、模擬器、媒體播放器等多媒體應用領域。用下面這張圖可以很明確地說明SDL的用途。

 

SDL實際上並不限於視音頻的播放,它將功能分成下列數個子系統(subsystem):

Video(圖像):圖像控制以及線程(thread)和事件管理(event)。

Audio(聲音):聲音控制

Joystick(搖桿):遊戲搖桿控制

CD-ROM(光盤驅動器):光盤媒體控制

Window Management(視窗管理):與視窗程序設計集成

Event(事件驅動):處理事件驅動

在Windows下,SDL與DirectX的對應關係如下。

SDL

DirectX

SDL_Video、SDL_Image

DirectDraw、Direct3D

SDL_Audio、SDL_Mixer

DirectSound

SDL_Joystick、SDL_Base

DirectInput

SDL_Net

DirectPlay



注:上文內容在《使用SDL播放視頻》的文章中已經介紹,這裏再次重複貼一遍。

SDL播放音頻的流程

SDL播放音頻的流程狠簡單,分爲以下步驟。

1. 初始化

1) 初始化SDL。

2) 根據參數(SDL_AudioSpec)打開音頻設備

2. 循環播放數據

1) 播放音頻數據。

2) 延時等待播放完成。



下面詳細分析一下上文流程。


1. 初始化

1) 初始化SDL。

使用SDL_Init()初始化SDL。該函數可以確定希望激活的子系統。SDL_Init()函數原型如下:
[cpp] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. int SDLCALL SDL_Init(Uint32 flags)  

其中,flags可以取下列值:
SDL_INIT_TIMER:定時器
SDL_INIT_AUDIO:音頻
SDL_INIT_VIDEO:視頻
SDL_INIT_JOYSTICK:搖桿
SDL_INIT_HAPTIC:觸摸屏
SDL_INIT_GAMECONTROLLER:遊戲控制器
SDL_INIT_EVENTS:事件
SDL_INIT_NOPARACHUTE:不捕獲關鍵信號(這個不理解)
SDL_INIT_EVERYTHING:包含上述所有選項

有關SDL_Init()有一點需要注意:初始化的時候儘量做到“夠用就好”,而不要用SDL_INIT_EVERYTHING。因爲有些情況下使用SDL_INIT_EVERYTHING會出現一些不可預知的問題。例如,在MFC應用程序中播放純音頻,如果初始化SDL的時候使用SDL_INIT_EVERYTHING,那麼就會出現聽不到聲音的情況。後來發現,去掉了SDL_INIT_VIDEO之後,問題才得以解決。

2) 根據參數(SDL_AudioSpec)打開音頻設備
使用SDL_OpenAudio()打開音頻設備。該函數需要傳入一個SDL_AudioSpec的結構體。DL_OpenAudio()的原型如下。
[cpp] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. int SDLCALL SDL_OpenAudio(SDL_AudioSpec * desired,  
  2.                                           SDL_AudioSpec * obtained);  

它的參數是兩個SDL_AudioSpec結構體,它們的含義:
desired:期望的參數。
obtained:實際音頻設備的參數,一般情況下設置爲NULL即可。


SDL_AudioSpec結構體的定義如下。
[cpp] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. typedef struct SDL_AudioSpec  
  2. {  
  3.     int freq;                   /**< DSP frequency -- samples per second */  
  4.     SDL_AudioFormat format;     /**< Audio data format */  
  5.     Uint8 channels;             /**< Number of channels: 1 mono, 2 stereo */  
  6.     Uint8 silence;              /**< Audio buffer silence value (calculated) */  
  7.     Uint16 samples;             /**< Audio buffer size in samples (power of 2) */  
  8.     Uint16 padding;             /**< Necessary for some compile environments */  
  9.     Uint32 size;                /**< Audio buffer size in bytes (calculated) */  
  10.     SDL_AudioCallback callback;  
  11.     void *userdata;  
  12. } SDL_AudioSpec;  

其中包含了關於音頻各種參數:
freq:音頻數據的採樣率。常用的有48000,44100等。
format:音頻數據的格式。舉例幾種格式:
AUDIO_U16SYS:Unsigned 16-bit samples
AUDIO_S16SYS:Signed 16-bit samples
AUDIO_S32SYS:32-bit integer samples
AUDIO_F32SYS:32-bit floating point samples
channels:聲道數。例如單聲道取值爲1,立體聲取值爲2。
silence:設置靜音的值。
samples:音頻緩衝區中的採樣個數,要求必須是2的n次方。
padding:考慮到兼容性的一個參數。
size:音頻緩衝區的大小,以字節爲單位。
callback:填充音頻緩衝區的回調函數。
userdata:用戶自定義的數據。
在這裏記錄一下填充音頻緩衝區的回調函數的作用。當音頻設備需要更多數據的時候會調用該回調函數。回調函數的格式要求如下。
[cpp] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. void (SDLCALL * SDL_AudioCallback) (void *userdata, Uint8 * stream,  
  2.                                             int len);  

回調函數的參數含義如下所示。
userdata:SDL_AudioSpec結構中的用戶自定義數據,一般情況下可以不用。
stream:該指針指向需要填充的音頻緩衝區。
len:音頻緩衝區的大小(以字節爲單位)。
在回調函數中可以使用SDL_MixAudio()完成混音等工作。衆所周知SDL2和SDL1.x關於視頻方面的API差別很大。但是SDL2和SDL1.x關於音頻方面的API是一模一樣的。唯獨在回調函數中,SDL2有一個地方和SDL1.x不一樣:SDL2中必須首先使用SDL_memset()將stream中的數據設置爲0。


2. 循環播放數據
1) 播放音頻數據。

使用SDL_PauseAudio()可以播放音頻數據。SDL_PauseAudio()的原型如下。
[cpp] view plain copy
 在CODE上查看代碼片派生到我的代碼片
  1. void SDLCALL SDL_PauseAudio(int pause_on)  

當pause_on設置爲0的時候即可開始播放音頻數據。設置爲1的時候,將會播放靜音的值。

2) 延時等待播放完成。
這一步就是延時等待音頻播放完畢了。使用像SDL_Delay()這樣的延時函數即可。

代碼

源代碼如下所示。
[cpp] view plain copy
  1. /** 
  2.  * 最簡單的SDL2播放音頻的例子(SDL2播放PCM) 
  3.  * Simplest Audio Play SDL2 (SDL2 play PCM)  
  4.  * 
  5.  * 雷霄驊 Lei Xiaohua 
  6.  * [email protected] 
  7.  * 中國傳媒大學/數字電視技術 
  8.  * Communication University of China / Digital TV Technology 
  9.  * http://blog.csdn.net/leixiaohua1020 
  10.  * 
  11.  * 本程序使用SDL2播放PCM音頻採樣數據。SDL實際上是對底層繪圖 
  12.  * API(Direct3D,OpenGL)的封裝,使用起來明顯簡單于直接調用底層 
  13.  * API。 
  14.  * 
  15.  * 函數調用步驟如下:  
  16.  * 
  17.  * [初始化] 
  18.  * SDL_Init(): 初始化SDL。 
  19.  * SDL_OpenAudio(): 根據參數(存儲於SDL_AudioSpec)打開音頻設備。 
  20.  * SDL_PauseAudio(): 播放音頻數據。 
  21.  * 
  22.  * [循環播放數據] 
  23.  * SDL_Delay(): 延時等待播放完成。 
  24.  * 
  25.  * This software plays PCM raw audio data using SDL2. 
  26.  * SDL is a wrapper of low-level API (DirectSound). 
  27.  * Use SDL is much easier than directly call these low-level API. 
  28.  * 
  29.  * The process is shown as follows: 
  30.  * 
  31.  * [Init] 
  32.  * SDL_Init(): Init SDL. 
  33.  * SDL_OpenAudio(): Opens the audio device with the desired  
  34.  *                  parameters (In SDL_AudioSpec). 
  35.  * SDL_PauseAudio(): Play Audio. 
  36.  * 
  37.  * [Loop to play data] 
  38.  * SDL_Delay(): Wait for completetion of playback. 
  39.  */  
  40.   
  41. #include <stdio.h>  
  42. #include <tchar.h>  
  43.   
  44. extern "C"  
  45. {  
  46. #include "sdl/SDL.h"  
  47. };  
  48.   
  49. //Buffer:  
  50. //|-----------|-------------|  
  51. //chunk-------pos---len-----|  
  52. static  Uint8  *audio_chunk;   
  53. static  Uint32  audio_len;   
  54. static  Uint8  *audio_pos;   
  55.   
  56. /* Audio Callback 
  57.  * The audio function callback takes the following parameters:  
  58.  * stream: A pointer to the audio buffer to be filled  
  59.  * len: The length (in bytes) of the audio buffer  
  60.  *  
  61. */   
  62. void  fill_audio(void *udata,Uint8 *stream,int len){   
  63.     //SDL 2.0  
  64.     SDL_memset(stream, 0, len);  
  65.     if(audio_len==0)  
  66.             return;   
  67.     len=(len>audio_len?audio_len:len);  
  68.   
  69.     SDL_MixAudio(stream,audio_pos,len,SDL_MIX_MAXVOLUME);  
  70.     audio_pos += len;   
  71.     audio_len -= len;   
  72. }   
  73.   
  74. int main(int argc, char* argv[])  
  75. {  
  76.     //Init  
  77.     if(SDL_Init(SDL_INIT_AUDIO | SDL_INIT_TIMER)) {    
  78.         printf( "Could not initialize SDL - %s\n", SDL_GetError());   
  79.         return -1;  
  80.     }  
  81.     //SDL_AudioSpec  
  82.     SDL_AudioSpec wanted_spec;  
  83.     wanted_spec.freq = 44100;   
  84.     wanted_spec.format = AUDIO_S16SYS;   
  85.     wanted_spec.channels = 2;   
  86.     wanted_spec.silence = 0;   
  87.     wanted_spec.samples = 1024;   
  88.     wanted_spec.callback = fill_audio;   
  89.   
  90.     if (SDL_OpenAudio(&wanted_spec, NULL)<0){   
  91.         printf("can't open audio.\n");   
  92.         return -1;   
  93.     }   
  94.   
  95.     FILE *fp=fopen("../NocturneNo2inEflat_44.1k_s16le.pcm","rb+");  
  96.     if(fp==NULL){  
  97.         printf("cannot open this file\n");  
  98.         return -1;  
  99.     }  
  100.     int pcm_buffer_size=4096;  
  101.     char *pcm_buffer=(char *)malloc(pcm_buffer_size);  
  102.     int data_count=0;  
  103.   
  104.     //Play  
  105.     SDL_PauseAudio(0);  
  106.   
  107.     while(1){  
  108.         if (fread(pcm_buffer, 1, pcm_buffer_size, fp) != pcm_buffer_size){  
  109.             // Loop  
  110.             fseek(fp, 0, SEEK_SET);  
  111.             fread(pcm_buffer, 1, pcm_buffer_size, fp);  
  112.             data_count=0;  
  113.         }  
  114.         printf("Now Playing %10d Bytes data.\n",data_count);  
  115.         data_count+=pcm_buffer_size;  
  116.         //Set audio buffer (PCM data)  
  117.         audio_chunk = (Uint8 *) pcm_buffer;   
  118.         //Audio buffer length  
  119.         audio_len =pcm_buffer_size;  
  120.         audio_pos = audio_chunk;  
  121.           
  122.         while(audio_len>0)//Wait until finish  
  123.             SDL_Delay(1);   
  124.     }  
  125.     free(pcm_buffer);  
  126.     SDL_Quit();  
  127.   
  128.     return 0;  
  129. }  


運行結果

運行的結果如下圖所示。運行的時候可以聽見音樂播放的聲音。

 

下載

代碼位於“Simplest Media Play”中



SourceForge項目地址:https://sourceforge.net/projects/simplestmediaplay/

CSDN下載地址:http://download.csdn.net/detail/leixiaohua1020/8054395

注:

該項目會不定時的更新並修復一些小問題,最新的版本請參考該系列文章的總述頁面:

 《最簡單的視音頻播放示例1:總述》


上述工程包含了使用各種API(Direct3D,OpenGL,GDI,DirectSound,SDL2)播放多媒體例子。其中音頻輸入爲PCM採樣數據。輸出至系統的聲卡播放出來。視頻輸入爲YUV/RGB像素數據。輸出至顯示器上的一個窗口播放出來。
通過本工程的代碼初學者可以快速學習使用這幾個API播放視頻和音頻的技術。
一共包括瞭如下幾個子工程:
simplest_audio_play_directsound:  使用DirectSound播放PCM音頻採樣數據。
simplest_audio_play_sdl2:  使用SDL2播放PCM音頻採樣數據。
simplest_video_play_direct3d:  使用Direct3D的Surface播放RGB/YUV視頻像素數據。
simplest_video_play_direct3d_texture:使用Direct3D的Texture播放RGB視頻像素數據。
simplest_video_play_gdi:  使用GDI播放RGB/YUV視頻像素數據。
simplest_video_play_opengl:  使用OpenGL播放RGB/YUV視頻像素數據。
simplest_video_play_opengl_texture: 使用OpenGL的Texture播放YUV視頻像素數據。

simplest_video_play_sdl2:  使用SDL2播放RGB/YUV視頻像素數據。


轉帖:http://blog.csdn.net/leixiaohua1020/article/details/40544521

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章