怎樣使用alsa API


翻譯文章的鏈接:

http://equalarea.com/paul/alsa-audio.html

關於怎麼使用ALSA API教程

        這份文檔幫助對ALSA API使用入門。不是一個完整的ALSA API參考手冊(詳細參考手冊地址是:http://www.alsa-project.org/alsa-doc/alsa-lib/),並且不包括複雜軟件需要處理的細節部分。而它爲有編程經驗的但對這些API是新手的程序員提供充足的背景知識,以寫出一個簡單的程序。在這份文檔中所有的代碼的許可證遵守GNU Public License的,如果你打算在其他許可證下用ALSA寫軟件,我建議你去發現其他的文檔。  主要內容:

        (1)理解音頻接口

        (2)典型音頻應用是什麼樣子的

        (3)一個最小回放程序

        (4)一個最小採集程序

        (5)一個最小基於中斷驅動的程序

                   (6)寫程序過程

                打開設備

                設置參數

                接受和發送數據

理解音頻接口

我們首先回顧音頻接口的基本設計。作爲一個應用程序程序員,實際你沒有必要爲操作層擔憂,它由ALSA提供的一個插件設備驅動全部考錄,但是如果你想要些一個有效率並且靈活的軟件,你必須在概念上理解操作層都做了些什麼。

(音頻接口、音頻設備、聲卡。在此處是一個概念。)

音頻接口是一個設備(譯者注:聲卡),允許計算機從外界接受和向外界發送音頻數據。在計算機內部,音頻數據像其他任何數據一樣代表了比特流。然而,聲音接口可以發送數字聲音信號和接受模擬聲音信號。這兩種情況下,計算機使用的代表聲音的比特流需要被轉化,在被送到外界之前,同樣,被音頻接口接受的外部信號也需要被轉化,使之變爲對計算機有用的數據(可用的數據)。這兩個轉化就是音頻接口存在的目的

在音頻接口中,有個區域被稱爲“硬件緩衝區”,當一個外界音頻信號到達後,這個設備轉換這個模擬信號爲計算機可以使用的比特流,並且存儲這些數據在硬件緩衝區,被用來傳遞給計算機。當在硬件緩衝區採集到了足夠多的數據,音頻接口對計算機產生一箇中斷,以告訴計算機數據準備好了,可以從硬件緩衝區,取出了。相反,對於數據從計算機內部送到外界時,有一個和以上有個相似的過程。設備產生對計算機產生中斷,告訴計算機,硬件緩衝區有空間,計算機可以存數據在硬件緩衝區。設備然後轉化這些比特流爲外界需要的無論什麼格式,並且發送它。理解設備使用這個緩衝區作爲一個循環緩衝區是很重要的。當到達了緩衝區的末尾,指針回到頭,繼續開始。

爲了這個過程可以正確的運行,一些變量需要被配置,他們包括:

(1)當在計算機使用的比特流和外界使用的信號之間的轉換時,設備應該使用什麼格式?

(2)採樣樣本以多少的比特率在設備和計算機直接傳遞?

(3)設備對計算機產生中斷時,硬件緩衝區應該有多少數據(接受)或者空間(發送)?

(4)硬件緩衝區應該多大?

頭兩個問題是音頻數據質量調節的基礎。後兩個問題是影響音頻信號的延時,這個延時指的是在這些之間的延時:

1.輸入延時:由設備從外界採集到的音頻數據到達計算機之間。

2.輸出延時:由計算機發送的數據,到達外界時之間的延時。

這兩者對於很多的音頻軟件是很重要的,儘管一些程序不需要關心這些事情。

最小的播放程序

這個程序用播放模式打開一個音頻設備,配置爲立體音,16bit(位深),採樣頻率44.1KHZ,交錯模式,常見的read/write存取模式。然後,發送一塊任意數據到設備中,最後退出程序。

#include <stdio.h>
	#include <stdlib.h>
	#include <alsa/asoundlib.h>
	      
	main (int argc, char *argv[])
	{
		int i;
		int err;
		short buf[128];
		snd_pcm_t *playback_handle;
		snd_pcm_hw_params_t *hw_params;
	
		if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		if ((err = snd_pcm_prepare (playback_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		for (i = 0; i < 10; ++i) {
			if ((err = snd_pcm_writei (playback_handle, buf, 128)) != 128) {
				fprintf (stderr, "write to audio interface failed (%s)\n",
					 snd_strerror (err));
				exit (1);
			}
		}
	
		snd_pcm_close (playback_handle);
		exit (0);
	}


 

最小採集程序:

爲了採集音頻數據,程序打開一個音頻設備,配置爲立體音,位深16bit,採集頻率爲44.1KHz,交錯模式,常見的read/write存取數據,然後讀取一塊任意數據從硬件緩衝區,最後退出程序。

#include <stdio.h>
	#include <stdlib.h>
	#include <alsa/asoundlib.h>
	      
	main (int argc, char *argv[])
	{
		int i;
		int err;
		short buf[128];
		snd_pcm_t *capture_handle;
		snd_pcm_hw_params_t *hw_params;
	
		if ((err = snd_pcm_open (&capture_handle, argv[1], SND_PCM_STREAM_CAPTURE, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (capture_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (capture_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (capture_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (capture_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (capture_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (capture_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		if ((err = snd_pcm_prepare (capture_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		for (i = 0; i < 10; ++i) {
			if ((err = snd_pcm_readi (capture_handle, buf, 128)) != 128) {
				fprintf (stderr, "read from audio interface failed (%s)\n",
					 snd_strerror (err));
				exit (1);
			}
		}
	
		snd_pcm_close (capture_handle);
		exit (0);
	}


程序用播放模式,打開一個音頻設備,配置爲立體音,位深16bit,採集頻率爲44.1KHz,交錯模式,常見的read/write存取數據。程序一直等待,直到設備準備好了接受回放數據,準備好同時,發送任意數據到硬件緩衝區,這個設計允許你的程序被移植到依靠回調函數驅動的機制,例如,jack,ladspa,coreaudio,vst 和其他。

      #include <stdio.h>
	#include <stdlib.h>
	#include <errno.h>
	#include <poll.h>
	#include <alsa/asoundlib.h>
	      
	snd_pcm_t *playback_handle;
	short buf[4096];
	
	int
	playback_callback (snd_pcm_sframes_t nframes)
	{
		int err;
	
		printf ("playback callback called with %u frames\n", nframes);
	
		/* ... fill buf with data ... */
	
		if ((err = snd_pcm_writei (playback_handle, buf, nframes)) < 0) {
			fprintf (stderr, "write failed (%s)\n", snd_strerror (err));
		}
	
		return err;
	}
	      
	main (int argc, char *argv[])
	{
	
		snd_pcm_hw_params_t *hw_params;
		snd_pcm_sw_params_t *sw_params;
		snd_pcm_sframes_t frames_to_deliver;
		int nfds;
		int err;
		struct pollfd *pfds;
	
		if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		/* tell ALSA to wake us up whenever 4096 or more frames
		   of playback data can be delivered. Also, tell
		   ALSA that we'll start the device ourselves.
		*/
	
		if ((err = snd_pcm_sw_params_malloc (&sw_params)) < 0) {
			fprintf (stderr, "cannot allocate software parameters structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_current (playback_handle, sw_params)) < 0) {
			fprintf (stderr, "cannot initialize software parameters structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_set_avail_min (playback_handle, sw_params, 4096)) < 0) {
			fprintf (stderr, "cannot set minimum available count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_set_start_threshold (playback_handle, sw_params, 0U)) < 0) {
			fprintf (stderr, "cannot set start mode (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params (playback_handle, sw_params)) < 0) {
			fprintf (stderr, "cannot set software parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		/* the interface will interrupt the kernel every 4096 frames, and ALSA
		   will wake up this program very soon after that.
		*/
	
		if ((err = snd_pcm_prepare (playback_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		while (1) {
	
			/* wait till the interface is ready for data, or 1 second
			   has elapsed.
			*/
	
			if ((err = snd_pcm_wait (playback_handle, 1000)) < 0) {
			        fprintf (stderr, "poll failed (%s)\n", strerror (errno));
			        break;
			}	           
	
			/* find out how much space is available for playback data */
	
			if ((frames_to_deliver = snd_pcm_avail_update (playback_handle)) < 0) {
				if (frames_to_deliver == -EPIPE) {
					fprintf (stderr, "an xrun occured\n");
					break;
				} else {
					fprintf (stderr, "unknown ALSA avail update return value (%d)\n", 
						 frames_to_deliver);
					break;
				}
			}
	
			frames_to_deliver = frames_to_deliver > 4096 ? 4096 : frames_to_deliver;
	
			/* deliver the data */
	
			if (playback_callback (frames_to_deliver) != frames_to_deliver) {
			        fprintf (stderr, "playback callback failed\n");
				break;
			}
		}
	
		snd_pcm_close (playback_handle);
		exit (0);
	}


 

 最小全雙工程序:

全雙工可以通過結合上述所展示的回放和採集程序實現。雖然,很多的現有的linux音頻程序使用這種設計,但是在作者看來,這個是有很大的缺陷。上訴的中斷驅動例子在很多場合下代表一個基本的較好的設計。若是將中斷驅動擴展爲全雙工是相當複雜的。這就是爲什麼我建議你忘記這個。

術語:

捕捉:從外界採集數據(“記錄”和採集不同,記錄意味着將存儲在某地方,不是alsa API的一部分)。

回放:將數據發送到外界,以致外界可以聽到聲音。

全雙工:捕捉和回放在同一個設備同一時間發生的狀態。

xrun:一旦音頻接口開始運轉,它將一直運轉,知道告訴它停止。設備將產生數據爲計算機去使用或者計算機發送數據到外界。由於很多原因,你的可能跟不上設備的速度。對於回放來說,可能導致一種結果,音頻設備需要的數據從計算機中,但是計算機沒有及時發送給設備,而導致設備使用留在硬件緩衝區中的舊數據,這種情況叫做underrun。對於捕捉情況,設備產生了計算機可用的數據,但是沒有空間去存儲這些數據了,設備不得不重寫硬件緩衝區的一部分,而被重寫的這部分數據計算機還沒有得到,這樣數據就丟失了,這個叫做overrun。簡單起見,我們使用xrun表示這兩種情況。

pcm

Pulse Code Modulation(脈衝編碼調製),這個術語描述的是一種方法,用來轉換模擬信號爲數字信號。這種方法被絕大數的計算機音頻設備使用,並且ALSA API使用它對音頻作爲代替。

聲道

幀:在單聲道中,一個樣本是一個單一的值,用來描述在一個採樣點上音頻信號的振幅。當我們談論關於數字音頻的時候,我們經常談論這些數據,這些數據描述了在一個採樣點上所有的聲道。一集合的樣本通常叫做幀,每個聲道一個集合。我經常用幀數表示時間的流逝,這個大概和人們用樣本測量的精度差不多,但是幀更精確。更重要的是,當我們談論一個採樣點上的描述所有聲道的數據集合,他是一個單元纔有意義。幾乎每個ALSA API函數使用幀作爲數據數量的測量單元。

交錯模式:一種數據佈局(格式安排)。在一個採樣點上,每個聲道上的採樣數據連續的緊挨着另一個聲道的採樣數據。

非交錯模式:一種數據佈局。一個信道的所有樣本數據存儲在另外一個信道的數據之後。
採樣時鐘:一個時鐘源,在 計算機採集或播放時標記時間。一些音頻設備可以使你使用外部時鐘源,不是字時鐘就是自動同步時鐘。所有的音頻設備本省至少一個採樣時鐘源,典型的是晶體時鐘。一些音頻設備不允許時鐘的頻率被改變。一些時鐘不是你期望的那樣準確的頻率運行。沒有兩個採樣時鐘被期望運行時有相同的精確的頻率。如果你需要兩個樣本流去保持同步,他們必須使用同一個採樣時鐘。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章