翻譯文章的鏈接:
http://equalarea.com/paul/alsa-audio.html
關於怎麼使用ALSA API教程
這份文檔幫助對ALSA API使用入門。不是一個完整的ALSA API參考手冊(詳細參考手冊地址是:http://www.alsa-project.org/alsa-doc/alsa-lib/),並且不包括複雜軟件需要處理的細節部分。而它爲有編程經驗的但對這些API是新手的程序員提供充足的背景知識,以寫出一個簡單的程序。在這份文檔中所有的代碼的許可證遵守GNU Public License的,如果你打算在其他許可證下用ALSA寫軟件,我建議你去發現其他的文檔。 主要內容:
(1)理解音頻接口
(2)典型音頻應用是什麼樣子的
(3)一個最小回放程序
(4)一個最小採集程序
(5)一個最小基於中斷驅動的程序
(6)寫程序過程
打開設備
設置參數
接受和發送數據
理解音頻接口
我們首先回顧音頻接口的基本設計。作爲一個應用程序程序員,實際你沒有必要爲操作層擔憂,它由ALSA提供的一個插件設備驅動全部考錄,但是如果你想要些一個有效率並且靈活的軟件,你必須在概念上理解操作層都做了些什麼。
(音頻接口、音頻設備、聲卡。在此處是一個概念。)
音頻接口是一個設備(譯者注:聲卡),允許計算機從外界接受和向外界發送音頻數據。在計算機內部,音頻數據像其他任何數據一樣代表了比特流。然而,聲音接口可以發送數字聲音信號和接受模擬聲音信號。這兩種情況下,計算機使用的代表聲音的比特流需要被轉化,在被送到外界之前,同樣,被音頻接口接受的外部信號也需要被轉化,使之變爲對計算機有用的數據(可用的數據)。這兩個轉化就是音頻接口存在的目的
在音頻接口中,有個區域被稱爲“硬件緩衝區”,當一個外界音頻信號到達後,這個設備轉換這個模擬信號爲計算機可以使用的比特流,並且存儲這些數據在硬件緩衝區,被用來傳遞給計算機。當在硬件緩衝區採集到了足夠多的數據,音頻接口對計算機產生一箇中斷,以告訴計算機數據準備好了,可以從硬件緩衝區,取出了。相反,對於數據從計算機內部送到外界時,有一個和以上有個相似的過程。設備產生對計算機產生中斷,告訴計算機,硬件緩衝區有空間,計算機可以存數據在硬件緩衝區。設備然後轉化這些比特流爲外界需要的無論什麼格式,並且發送它。理解設備使用這個緩衝區作爲一個循環緩衝區是很重要的。當到達了緩衝區的末尾,指針回到頭,繼續開始。
爲了這個過程可以正確的運行,一些變量需要被配置,他們包括:
(1)當在計算機使用的比特流和外界使用的信號之間的轉換時,設備應該使用什麼格式?
(2)採樣樣本以多少的比特率在設備和計算機直接傳遞?
(3)設備對計算機產生中斷時,硬件緩衝區應該有多少數據(接受)或者空間(發送)?
(4)硬件緩衝區應該多大?
頭兩個問題是音頻數據質量調節的基礎。後兩個問題是影響音頻信號的延時,這個延時指的是在這些之間的延時:
1.輸入延時:由設備從外界採集到的音頻數據到達計算機之間。
2.輸出延時:由計算機發送的數據,到達外界時之間的延時。
這兩者對於很多的音頻軟件是很重要的,儘管一些程序不需要關心這些事情。
最小的播放程序
這個程序用播放模式打開一個音頻設備,配置爲立體音,16bit(位深),採樣頻率44.1KHZ,交錯模式,常見的read/write存取模式。然後,發送一塊任意數據到設備中,最後退出程序。
#include <stdio.h>
#include <stdlib.h>
#include <alsa/asoundlib.h>
main (int argc, char *argv[])
{
int i;
int err;
short buf[128];
snd_pcm_t *playback_handle;
snd_pcm_hw_params_t *hw_params;
if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
fprintf (stderr, "cannot open audio device %s (%s)\n",
argv[1],
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
fprintf (stderr, "cannot set access type (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
fprintf (stderr, "cannot set sample format (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
fprintf (stderr, "cannot set sample rate (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
fprintf (stderr, "cannot set channel count (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
fprintf (stderr, "cannot set parameters (%s)\n",
snd_strerror (err));
exit (1);
}
snd_pcm_hw_params_free (hw_params);
if ((err = snd_pcm_prepare (playback_handle)) < 0) {
fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
snd_strerror (err));
exit (1);
}
for (i = 0; i < 10; ++i) {
if ((err = snd_pcm_writei (playback_handle, buf, 128)) != 128) {
fprintf (stderr, "write to audio interface failed (%s)\n",
snd_strerror (err));
exit (1);
}
}
snd_pcm_close (playback_handle);
exit (0);
}
最小採集程序:
爲了採集音頻數據,程序打開一個音頻設備,配置爲立體音,位深16bit,採集頻率爲44.1KHz,交錯模式,常見的read/write存取數據,然後讀取一塊任意數據從硬件緩衝區,最後退出程序。
#include <stdio.h>
#include <stdlib.h>
#include <alsa/asoundlib.h>
main (int argc, char *argv[])
{
int i;
int err;
short buf[128];
snd_pcm_t *capture_handle;
snd_pcm_hw_params_t *hw_params;
if ((err = snd_pcm_open (&capture_handle, argv[1], SND_PCM_STREAM_CAPTURE, 0)) < 0) {
fprintf (stderr, "cannot open audio device %s (%s)\n",
argv[1],
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_any (capture_handle, hw_params)) < 0) {
fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_access (capture_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
fprintf (stderr, "cannot set access type (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_format (capture_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
fprintf (stderr, "cannot set sample format (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_rate_near (capture_handle, hw_params, 44100, 0)) < 0) {
fprintf (stderr, "cannot set sample rate (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_channels (capture_handle, hw_params, 2)) < 0) {
fprintf (stderr, "cannot set channel count (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params (capture_handle, hw_params)) < 0) {
fprintf (stderr, "cannot set parameters (%s)\n",
snd_strerror (err));
exit (1);
}
snd_pcm_hw_params_free (hw_params);
if ((err = snd_pcm_prepare (capture_handle)) < 0) {
fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
snd_strerror (err));
exit (1);
}
for (i = 0; i < 10; ++i) {
if ((err = snd_pcm_readi (capture_handle, buf, 128)) != 128) {
fprintf (stderr, "read from audio interface failed (%s)\n",
snd_strerror (err));
exit (1);
}
}
snd_pcm_close (capture_handle);
exit (0);
}
程序用播放模式,打開一個音頻設備,配置爲立體音,位深16bit,採集頻率爲44.1KHz,交錯模式,常見的read/write存取數據。程序一直等待,直到設備準備好了接受回放數據,準備好同時,發送任意數據到硬件緩衝區,這個設計允許你的程序被移植到依靠回調函數驅動的機制,例如,jack,ladspa,coreaudio,vst 和其他。
#include <stdio.h>
#include <stdlib.h>
#include <errno.h>
#include <poll.h>
#include <alsa/asoundlib.h>
snd_pcm_t *playback_handle;
short buf[4096];
int
playback_callback (snd_pcm_sframes_t nframes)
{
int err;
printf ("playback callback called with %u frames\n", nframes);
/* ... fill buf with data ... */
if ((err = snd_pcm_writei (playback_handle, buf, nframes)) < 0) {
fprintf (stderr, "write failed (%s)\n", snd_strerror (err));
}
return err;
}
main (int argc, char *argv[])
{
snd_pcm_hw_params_t *hw_params;
snd_pcm_sw_params_t *sw_params;
snd_pcm_sframes_t frames_to_deliver;
int nfds;
int err;
struct pollfd *pfds;
if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
fprintf (stderr, "cannot open audio device %s (%s)\n",
argv[1],
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
fprintf (stderr, "cannot set access type (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
fprintf (stderr, "cannot set sample format (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
fprintf (stderr, "cannot set sample rate (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
fprintf (stderr, "cannot set channel count (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
fprintf (stderr, "cannot set parameters (%s)\n",
snd_strerror (err));
exit (1);
}
snd_pcm_hw_params_free (hw_params);
/* tell ALSA to wake us up whenever 4096 or more frames
of playback data can be delivered. Also, tell
ALSA that we'll start the device ourselves.
*/
if ((err = snd_pcm_sw_params_malloc (&sw_params)) < 0) {
fprintf (stderr, "cannot allocate software parameters structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_sw_params_current (playback_handle, sw_params)) < 0) {
fprintf (stderr, "cannot initialize software parameters structure (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_sw_params_set_avail_min (playback_handle, sw_params, 4096)) < 0) {
fprintf (stderr, "cannot set minimum available count (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_sw_params_set_start_threshold (playback_handle, sw_params, 0U)) < 0) {
fprintf (stderr, "cannot set start mode (%s)\n",
snd_strerror (err));
exit (1);
}
if ((err = snd_pcm_sw_params (playback_handle, sw_params)) < 0) {
fprintf (stderr, "cannot set software parameters (%s)\n",
snd_strerror (err));
exit (1);
}
/* the interface will interrupt the kernel every 4096 frames, and ALSA
will wake up this program very soon after that.
*/
if ((err = snd_pcm_prepare (playback_handle)) < 0) {
fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
snd_strerror (err));
exit (1);
}
while (1) {
/* wait till the interface is ready for data, or 1 second
has elapsed.
*/
if ((err = snd_pcm_wait (playback_handle, 1000)) < 0) {
fprintf (stderr, "poll failed (%s)\n", strerror (errno));
break;
}
/* find out how much space is available for playback data */
if ((frames_to_deliver = snd_pcm_avail_update (playback_handle)) < 0) {
if (frames_to_deliver == -EPIPE) {
fprintf (stderr, "an xrun occured\n");
break;
} else {
fprintf (stderr, "unknown ALSA avail update return value (%d)\n",
frames_to_deliver);
break;
}
}
frames_to_deliver = frames_to_deliver > 4096 ? 4096 : frames_to_deliver;
/* deliver the data */
if (playback_callback (frames_to_deliver) != frames_to_deliver) {
fprintf (stderr, "playback callback failed\n");
break;
}
}
snd_pcm_close (playback_handle);
exit (0);
}
最小全雙工程序:
全雙工可以通過結合上述所展示的回放和採集程序實現。雖然,很多的現有的linux音頻程序使用這種設計,但是在作者看來,這個是有很大的缺陷。上訴的中斷驅動例子在很多場合下代表一個基本的較好的設計。若是將中斷驅動擴展爲全雙工是相當複雜的。這就是爲什麼我建議你忘記這個。
術語:
捕捉:從外界採集數據(“記錄”和採集不同,記錄意味着將存儲在某地方,不是alsa API的一部分)。
回放:將數據發送到外界,以致外界可以聽到聲音。
全雙工:捕捉和回放在同一個設備同一時間發生的狀態。
xrun:一旦音頻接口開始運轉,它將一直運轉,知道告訴它停止。設備將產生數據爲計算機去使用或者計算機發送數據到外界。由於很多原因,你的可能跟不上設備的速度。對於回放來說,可能導致一種結果,音頻設備需要的數據從計算機中,但是計算機沒有及時發送給設備,而導致設備使用留在硬件緩衝區中的舊數據,這種情況叫做underrun。對於捕捉情況,設備產生了計算機可用的數據,但是沒有空間去存儲這些數據了,設備不得不重寫硬件緩衝區的一部分,而被重寫的這部分數據計算機還沒有得到,這樣數據就丟失了,這個叫做overrun。簡單起見,我們使用xrun表示這兩種情況。pcm
Pulse Code Modulation(脈衝編碼調製),這個術語描述的是一種方法,用來轉換模擬信號爲數字信號。這種方法被絕大數的計算機音頻設備使用,並且ALSA API使用它對音頻作爲代替。
聲道
幀:在單聲道中,一個樣本是一個單一的值,用來描述在一個採樣點上音頻信號的振幅。當我們談論關於數字音頻的時候,我們經常談論這些數據,這些數據描述了在一個採樣點上所有的聲道。一集合的樣本通常叫做幀,每個聲道一個集合。我經常用幀數表示時間的流逝,這個大概和人們用樣本測量的精度差不多,但是幀更精確。更重要的是,當我們談論一個採樣點上的描述所有聲道的數據集合,他是一個單元纔有意義。幾乎每個ALSA API函數使用幀作爲數據數量的測量單元。
交錯模式:一種數據佈局(格式安排)。在一個採樣點上,每個聲道上的採樣數據連續的緊挨着另一個聲道的採樣數據。
非交錯模式:一種數據佈局。一個信道的所有樣本數據存儲在另外一個信道的數據之後。
採樣時鐘:一個時鐘源,在 計算機採集或播放時標記時間。一些音頻設備可以使你使用外部時鐘源,不是字時鐘就是自動同步時鐘。所有的音頻設備本省至少一個採樣時鐘源,典型的是晶體時鐘。一些音頻設備不允許時鐘的頻率被改變。一些時鐘不是你期望的那樣準確的頻率運行。沒有兩個採樣時鐘被期望運行時有相同的精確的頻率。如果你需要兩個樣本流去保持同步,他們必須使用同一個採樣時鐘。