怎樣使用alsa API

翻譯文章的鏈接：

http://equalarea.com/paul/alsa-audio.html

關於怎麼使用ALSA API教程

這份文檔幫助對ALSA API使用入門。不是一個完整的ALSA API參考手冊(詳細參考手冊地址是：http://www.alsa-project.org/alsa-doc/alsa-lib/)，並且不包括複雜軟件需要處理的細節部分。而它爲有編程經驗的但對這些API是新手的程序員提供充足的背景知識，以寫出一個簡單的程序。在這份文檔中所有的代碼的許可證遵守GNU Public License的，如果你打算在其他許可證下用ALSA寫軟件，我建議你去發現其他的文檔。主要內容：

(1)理解音頻接口

(2)典型音頻應用是什麼樣子的

(3)一個最小回放程序

(4)一個最小採集程序

(5)一個最小基於中斷驅動的程序

(6)寫程序過程

打開設備

設置參數

接受和發送數據

理解音頻接口

我們首先回顧音頻接口的基本設計。作爲一個應用程序程序員，實際你沒有必要爲操作層擔憂，它由ALSA提供的一個插件設備驅動全部考錄，但是如果你想要些一個有效率並且靈活的軟件，你必須在概念上理解操作層都做了些什麼。

（音頻接口、音頻設備、聲卡。在此處是一個概念。）

音頻接口是一個設備(譯者注：聲卡)，允許計算機從外界接受和向外界發送音頻數據。在計算機內部，音頻數據像其他任何數據一樣代表了比特流。然而，聲音接口可以發送數字聲音信號和接受模擬聲音信號。這兩種情況下，計算機使用的代表聲音的比特流需要被轉化，在被送到外界之前，同樣，被音頻接口接受的外部信號也需要被轉化，使之變爲對計算機有用的數據（可用的數據）。這兩個轉化就是音頻接口存在的目的

在音頻接口中，有個區域被稱爲“硬件緩衝區”，當一個外界音頻信號到達後，這個設備轉換這個模擬信號爲計算機可以使用的比特流，並且存儲這些數據在硬件緩衝區，被用來傳遞給計算機。當在硬件緩衝區採集到了足夠多的數據，音頻接口對計算機產生一箇中斷，以告訴計算機數據準備好了，可以從硬件緩衝區，取出了。相反，對於數據從計算機內部送到外界時，有一個和以上有個相似的過程。設備產生對計算機產生中斷，告訴計算機，硬件緩衝區有空間，計算機可以存數據在硬件緩衝區。設備然後轉化這些比特流爲外界需要的無論什麼格式，並且發送它。理解設備使用這個緩衝區作爲一個循環緩衝區是很重要的。當到達了緩衝區的末尾，指針回到頭，繼續開始。

爲了這個過程可以正確的運行，一些變量需要被配置，他們包括：

(1)當在計算機使用的比特流和外界使用的信號之間的轉換時，設備應該使用什麼格式？

(2)採樣樣本以多少的比特率在設備和計算機直接傳遞？

(3)設備對計算機產生中斷時，硬件緩衝區應該有多少數據(接受)或者空間(發送)？

(4)硬件緩衝區應該多大？

頭兩個問題是音頻數據質量調節的基礎。後兩個問題是影響音頻信號的延時，這個延時指的是在這些之間的延時：

1.輸入延時：由設備從外界採集到的音頻數據到達計算機之間。

2.輸出延時：由計算機發送的數據，到達外界時之間的延時。

這兩者對於很多的音頻軟件是很重要的，儘管一些程序不需要關心這些事情。

最小的播放程序

這個程序用播放模式打開一個音頻設備，配置爲立體音，16bit(位深)，採樣頻率44.1KHZ，交錯模式，常見的read/write存取模式。然後，發送一塊任意數據到設備中，最後退出程序。

#include <stdio.h>
	#include <stdlib.h>
	#include <alsa/asoundlib.h>
	      
	main (int argc, char *argv[])
	{
		int i;
		int err;
		short buf[128];
		snd_pcm_t *playback_handle;
		snd_pcm_hw_params_t *hw_params;
	
		if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		if ((err = snd_pcm_prepare (playback_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		for (i = 0; i < 10; ++i) {
			if ((err = snd_pcm_writei (playback_handle, buf, 128)) != 128) {
				fprintf (stderr, "write to audio interface failed (%s)\n",
					 snd_strerror (err));
				exit (1);
			}
		}
	
		snd_pcm_close (playback_handle);
		exit (0);
	}

最小採集程序：

爲了採集音頻數據，程序打開一個音頻設備，配置爲立體音，位深16bit，採集頻率爲44.1KHz，交錯模式，常見的read/write存取數據，然後讀取一塊任意數據從硬件緩衝區，最後退出程序。

#include <stdio.h>
	#include <stdlib.h>
	#include <alsa/asoundlib.h>
	      
	main (int argc, char *argv[])
	{
		int i;
		int err;
		short buf[128];
		snd_pcm_t *capture_handle;
		snd_pcm_hw_params_t *hw_params;
	
		if ((err = snd_pcm_open (&capture_handle, argv[1], SND_PCM_STREAM_CAPTURE, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (capture_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (capture_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (capture_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (capture_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (capture_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (capture_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		if ((err = snd_pcm_prepare (capture_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		for (i = 0; i < 10; ++i) {
			if ((err = snd_pcm_readi (capture_handle, buf, 128)) != 128) {
				fprintf (stderr, "read from audio interface failed (%s)\n",
					 snd_strerror (err));
				exit (1);
			}
		}
	
		snd_pcm_close (capture_handle);
		exit (0);
	}

程序用播放模式，打開一個音頻設備，配置爲立體音，位深16bit，採集頻率爲44.1KHz，交錯模式，常見的read/write存取數據。程序一直等待，直到設備準備好了接受回放數據，準備好同時，發送任意數據到硬件緩衝區，這個設計允許你的程序被移植到依靠回調函數驅動的機制，例如，jack,ladspa,coreaudio,vst 和其他。

      #include <stdio.h>
	#include <stdlib.h>
	#include <errno.h>
	#include <poll.h>
	#include <alsa/asoundlib.h>
	      
	snd_pcm_t *playback_handle;
	short buf[4096];
	
	int
	playback_callback (snd_pcm_sframes_t nframes)
	{
		int err;
	
		printf ("playback callback called with %u frames\n", nframes);
	
		/* ... fill buf with data ... */
	
		if ((err = snd_pcm_writei (playback_handle, buf, nframes)) < 0) {
			fprintf (stderr, "write failed (%s)\n", snd_strerror (err));
		}
	
		return err;
	}
	      
	main (int argc, char *argv[])
	{
	
		snd_pcm_hw_params_t *hw_params;
		snd_pcm_sw_params_t *sw_params;
		snd_pcm_sframes_t frames_to_deliver;
		int nfds;
		int err;
		struct pollfd *pfds;
	
		if ((err = snd_pcm_open (&playback_handle, argv[1], SND_PCM_STREAM_PLAYBACK, 0)) < 0) {
			fprintf (stderr, "cannot open audio device %s (%s)\n", 
				 argv[1],
				 snd_strerror (err));
			exit (1);
		}
		   
		if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {
			fprintf (stderr, "cannot allocate hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
				 
		if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot initialize hardware parameter structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params, SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {
			fprintf (stderr, "cannot set access type (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_format (playback_handle, hw_params, SND_PCM_FORMAT_S16_LE)) < 0) {
			fprintf (stderr, "cannot set sample format (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_rate_near (playback_handle, hw_params, 44100, 0)) < 0) {
			fprintf (stderr, "cannot set sample rate (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params_set_channels (playback_handle, hw_params, 2)) < 0) {
			fprintf (stderr, "cannot set channel count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		if ((err = snd_pcm_hw_params (playback_handle, hw_params)) < 0) {
			fprintf (stderr, "cannot set parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		snd_pcm_hw_params_free (hw_params);
	
		/* tell ALSA to wake us up whenever 4096 or more frames
		   of playback data can be delivered. Also, tell
		   ALSA that we'll start the device ourselves.
		*/
	
		if ((err = snd_pcm_sw_params_malloc (&sw_params)) < 0) {
			fprintf (stderr, "cannot allocate software parameters structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_current (playback_handle, sw_params)) < 0) {
			fprintf (stderr, "cannot initialize software parameters structure (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_set_avail_min (playback_handle, sw_params, 4096)) < 0) {
			fprintf (stderr, "cannot set minimum available count (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params_set_start_threshold (playback_handle, sw_params, 0U)) < 0) {
			fprintf (stderr, "cannot set start mode (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
		if ((err = snd_pcm_sw_params (playback_handle, sw_params)) < 0) {
			fprintf (stderr, "cannot set software parameters (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		/* the interface will interrupt the kernel every 4096 frames, and ALSA
		   will wake up this program very soon after that.
		*/
	
		if ((err = snd_pcm_prepare (playback_handle)) < 0) {
			fprintf (stderr, "cannot prepare audio interface for use (%s)\n",
				 snd_strerror (err));
			exit (1);
		}
	
		while (1) {
	
			/* wait till the interface is ready for data, or 1 second
			   has elapsed.
			*/
	
			if ((err = snd_pcm_wait (playback_handle, 1000)) < 0) {
			        fprintf (stderr, "poll failed (%s)\n", strerror (errno));
			        break;
			}	           
	
			/* find out how much space is available for playback data */
	
			if ((frames_to_deliver = snd_pcm_avail_update (playback_handle)) < 0) {
				if (frames_to_deliver == -EPIPE) {
					fprintf (stderr, "an xrun occured\n");
					break;
				} else {
					fprintf (stderr, "unknown ALSA avail update return value (%d)\n", 
						 frames_to_deliver);
					break;
				}
			}
	
			frames_to_deliver = frames_to_deliver > 4096 ? 4096 : frames_to_deliver;
	
			/* deliver the data */
	
			if (playback_callback (frames_to_deliver) != frames_to_deliver) {
			        fprintf (stderr, "playback callback failed\n");
				break;
			}
		}
	
		snd_pcm_close (playback_handle);
		exit (0);
	}

最小全雙工程序：

全雙工可以通過結合上述所展示的回放和採集程序實現。雖然，很多的現有的linux音頻程序使用這種設計，但是在作者看來，這個是有很大的缺陷。上訴的中斷驅動例子在很多場合下代表一個基本的較好的設計。若是將中斷驅動擴展爲全雙工是相當複雜的。這就是爲什麼我建議你忘記這個。

術語：

捕捉：從外界採集數據（“記錄”和採集不同，記錄意味着將存儲在某地方，不是alsa API的一部分）。

回放：將數據發送到外界，以致外界可以聽到聲音。

全雙工：捕捉和回放在同一個設備同一時間發生的狀態。

xrun：一旦音頻接口開始運轉，它將一直運轉，知道告訴它停止。設備將產生數據爲計算機去使用或者計算機發送數據到外界。由於很多原因，你的可能跟不上設備的速度。對於回放來說，可能導致一種結果，音頻設備需要的數據從計算機中，但是計算機沒有及時發送給設備，而導致設備使用留在硬件緩衝區中的舊數據，這種情況叫做underrun。對於捕捉情況，設備產生了計算機可用的數據，但是沒有空間去存儲這些數據了，設備不得不重寫硬件緩衝區的一部分，而被重寫的這部分數據計算機還沒有得到，這樣數據就丟失了，這個叫做overrun。簡單起見，我們使用xrun表示這兩種情況。

pcm

Pulse Code Modulation（脈衝編碼調製），這個術語描述的是一種方法，用來轉換模擬信號爲數字信號。這種方法被絕大數的計算機音頻設備使用，並且ALSA API使用它對音頻作爲代替。

聲道

幀：在單聲道中，一個樣本是一個單一的值，用來描述在一個採樣點上音頻信號的振幅。當我們談論關於數字音頻的時候，我們經常談論這些數據，這些數據描述了在一個採樣點上所有的聲道。一集合的樣本通常叫做幀，每個聲道一個集合。我經常用幀數表示時間的流逝，這個大概和人們用樣本測量的精度差不多，但是幀更精確。更重要的是，當我們談論一個採樣點上的描述所有聲道的數據集合，他是一個單元纔有意義。幾乎每個ALSA API函數使用幀作爲數據數量的測量單元。

交錯模式：一種數據佈局（格式安排）。在一個採樣點上，每個聲道上的採樣數據連續的緊挨着另一個聲道的採樣數據。

非交錯模式：一種數據佈局。一個信道的所有樣本數據存儲在另外一個信道的數據之後。
採樣時鐘：一個時鐘源，在計算機採集或播放時標記時間。一些音頻設備可以使你使用外部時鐘源，不是字時鐘就是自動同步時鐘。所有的音頻設備本省至少一個採樣時鐘源，典型的是晶體時鐘。一些音頻設備不允許時鐘的頻率被改變。一些時鐘不是你期望的那樣準確的頻率運行。沒有兩個採樣時鐘被期望運行時有相同的精確的頻率。如果你需要兩個樣本流去保持同步，他們必須使用同一個採樣時鐘。

怎樣使用alsa API

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

java由於越界導致的報錯

音頻格式、編解碼2

怎樣使用alsa API

使用mdev在/dev/下創建子目錄放置設備節點

基於mini2440的USB視頻採集

video caputure device linux v4l2 API usag

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結