安卓錄製MP3(二) - LAME使用 錄音PCM 使用LAME進行MP3編碼 lame基本使用 結合JNI進行使用 DEMO代碼

上篇文章介紹了數字音頻的基礎知識,這篇文章我們來看看代碼應該怎麼寫:

錄音PCM

第一步我們先用AudioRecord錄製PCM音頻:

private lateinit var buffer: ByteArray

fun start(audioSource: Int, sampleRate: Int, channelConfig: Int, audioFormat: Int): Boolean {
    ...
    val bufferSize = AudioRecord.getMinBufferSize(sampleRate, channelConfig, audioFormat)

    buffer = ByteArray(bufferSize)
    recorder = AudioRecord(audioSource, sampleRate, channelConfig, audioFormat, bufferSize)

    recorderThread = RecordThread()
    recorderThread?.start()
    return true
}

inner class RecordThread : Thread() {
    override fun run() {
        super.run()

        var readLen: Int
        recorder?.startRecording()
        while (recorder?.recordingState == AudioRecord.RECORDSTATE_RECORDING) {
            readLen = recorder?.read(buffer, 0, buffer.size) ?: break
            listener.onRecord(buffer, readLen)
        }
        recorder = null
    }
}

可以看到AudioRecord的使用很簡單,就是創建一個AudioRecord對象然後在子線程中不斷地read就好,audioSource指的是通過哪個設備錄音,其他的幾個參數在基礎部分都有講過,就不過多介紹了:

private const val AUDIO_SOURCE = MediaRecorder.AudioSource.MIC
private const val SAMPLE_RATE = 44100
private const val AUDIO_FORMAT = AudioFormat.ENCODING_PCM_16BIT
private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_MONO // 單通道
//private const val CHANNEL_CONFIG = AudioFormat.CHANNEL_IN_STEREO // 雙通道
recorder.start(AUDIO_SOURCE, SAMPLE_RATE, CHANNEL_CONFIG, AUDIO_FORMAT)

當然,記得需要申請錄音權限:

<uses-permission android:name="android.permission.RECORD_AUDIO" />

使用LAME進行MP3編碼

得到PCM裸流之後我們就需要對他進行MP3編碼,LAME就是一個開源的MP3音頻壓縮軟件,也是公認有損MP3中壓縮效果最好的編碼器。

編譯

使用LAME需要自行編譯出靜態庫,首先我們從LAME的官網下載最新版本的LAME源碼。從源碼文件目錄結構中可以看出它使用AutoMake編譯,之前寫過幾篇AutoMake的學習筆記,感興趣的同學可以看看。

或者也可以直接修改Demo工程的build-lame.sh。修改開頭的NDK路徑、安卓版本、abi這幾個參數接口直接運行在output目錄生成出.a文件和.h文件:

#!/bin/zsh

NDK_ROOT=/Users/linjw/Library/Android/sdk/ndk/22.1.7171670
ANDROID_API_VERSION=21
NDK_TOOLCHAIN_ABI_VERSION=4.9
ABIS=(armeabi armeabi-v7a arm64-v8a x86 x86_64)
...

導入AndroidStudio

得到靜態庫之後在CMake中導入靜態庫:

cmake_minimum_required(VERSION 3.18.1)


project("lame")

add_library(
        lame
        SHARED
        native-lib.cpp)

# 導入lame頭文件
include_directories(${CMAKE_SOURCE_DIR}/include)

#導入lame靜態庫
add_library(mp3lame STATIC IMPORTED)
set_target_properties(
        mp3lame
        PROPERTIES IMPORTED_LOCATION
        ${CMAKE_SOURCE_DIR}/../../../jniLibs/${ANDROID_ABI}/libmp3lame.a)

find_library(
        log-lib
        log)

target_link_libraries(
        lame
        mp3lame # 鏈接lame靜態庫
        ${log-lib})

lame基本使用

初始化

在瞭解了MP3的基礎知識之後其實很容易上手lame。

第一步無非就是一些音頻參數的初始化設置:

第一步: 創建lame_global_flags*
lame_global_flags *client = lame_init();

第二步: 配置參數
lame_set_in_samplerate(client, 44100);    // 輸入採樣率
lame_set_out_samplerate(client, 44100);   // 輸出採樣率44100
lame_set_num_channels(client, 2);         // 通道數2
lame_set_brate(client, 128);              // 比特率128kbps
lame_set_quality(client, 2);              // 編碼質量2
lame_init_params(client);                 // 初始化參數

編碼質量

上面的參數大部分都在前一篇介紹過了,只剩一個編碼質量沒講過,他其實是用來選擇壓縮算法的。算法編號從0到9,0音質最好但是算法最複雜也最耗時,9音質最差但算法效率最高。一般會選擇2。

比特率和壓縮算法都能決定MP3的音質。壓縮前的PCM裸流音質最好,大小最大。

由於MP3的大小等於比特率乘時長,壓縮後的MP3比特率越大,那麼它的大小就越大,就越接近壓縮前的PCM,損失的信息也就越少,解壓之後就越接近原本的PCM的曲線,音質自然就越好。

而選擇壓縮算法的意義在於,在相同比特率的情況下( MP3文件大小相同),好的壓縮算法解壓出來的聲音曲線能更接近原本的PCM曲線,但是相應的它的計算量就會更大。

可以說選擇大的比特率是用存儲空間換音質,而選擇音質高的壓縮算法則是用cpu資源換音質。

MP3編碼

配置好初始化參數之後就只要將PCM數據傳遞給LAME進行壓縮即可,這裏有幾種PCM的傳遞方式:

1. 左右通道分開輸入

雙通道立體聲,有時候左右通道的數據會放在不同的文件裏面,可以使用下面的方法去編碼MP3:

int CDECL lame_encode_buffer (
        lame_global_flags*  gfp,           /* global context handle         */
        const short int     buffer_l [],   /* PCM data for left channel     */
        const short int     buffer_r [],   /* PCM data for right channel    */
        const int           nsamples,      /* number of samples per channel */
        unsigned char*      mp3buf,        /* pointer to encoded MP3 stream */
        const int           mp3buf_size ); /* number of valid octets in this stream */
  • gfp : lame_init返回的lame_global_flags*
  • buffer_l : 左通道數據
  • buffer_r : 右通道數據
  • nsamples : 每個通道的採樣點數量。例如當AudioFormat爲16bit的時候, 一個採樣點大小爲2byte, 則nsamples = buffer_l有效數據長度(byte) / 2
  • mp3buf : 編碼後的MP3會存放到這裏
  • mp3buf_size : mp3buf的大小,它可以通過採樣率、比特率和前面的nsamples計算出來,不過LAME提供了一個最大buffer大小計算的簡單算法(1.25*nsamples + 7200 byte)

他的返回值如下:

  • >=0 : 編碼後的MP3數據的大小,即存儲到mp3buf的MP3音頻的byte數
  • -1 : mp3buf的大小太小
  • -2 : malloc()方法出現問題
  • -3 : lame_init_params()沒有調用
  • -4 : 音頻數據異常

參考代碼:

int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);

2. 單通道輸入

有時候我們的數據只會有一個通道的數據,例如AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_MONO。

這個時候我們只需要把right輸入設置成NULL即可:

int encodeSize = lame_encode_buffer(client, left, null, numSamples, result, resultSize);

3. 多通道混合輸入

當AudioRecord的ChannelConfig配置成AudioFormat.CHANNEL_IN_STEREO。左右聲道的數據會交叉存儲在PCM裸流中。或者其他更多通道混合輸入的時候我們可以用lame_encode_buffer_interleaved方法進行編碼:

int CDECL lame_encode_buffer_interleaved(
        lame_global_flags*  gfp,           /* global context  handlei */
        short int           pcm[],         /* PCM data for left and right channel, interleaved */
        int                 num_samples,   /* number of samples per channel,  _not_ number of samples in pcm [] */
        unsigned char*      mp3buf,        /* pointer to encoded MP3 stream */
        int                 mp3buf_size ); /* number of valid octets in this stream */ 

指的注意的是,這裏的num_samples指的是每個通道的採樣點數,而不是所有通道的採樣點數之和。

例如當AudioFormat爲16bit、雙通道輸入的時候, 一個採樣點大小爲2byte, 則

nsamples = buffer_l有效數據長度(byte) / 2(16bite爲2byte) / 2(通道數爲2)

int encodeSize = lame_encode_buffer_interleaved(client, pcm, numSamples, result, resultSize);

清理工作

當編碼結束之後我們可以用lame_close方法進行清理:

lame_close(client);

結合JNI進行使用

由於LAEM的使用需要保存lame_global_flags,我們可以將它強轉成long傳到java進行保存,在需要的時候再講傳入的long強轉回lame_global_flags:

class LameMp3 {
    private var lameClientPtr: Long = createLameMp3Client()

    fun destroy(): Int {
        val ret = close(lameClientPtr)
        lameClientPtr = 0
        return ret
    }

    ...
    private external fun createLameMp3Client(): Long
    private external fun close(client: Long): Int
    ...
}

extern "C" JNIEXPORT jlong JNICALL
Java_me_linjw_lib_lame_LameMp3_createLameMp3Client(
        JNIEnv *env,
        jobject thiz) {
    lame_global_flags *client = lame_init();
    LOGD("createLameMp3Client: %ld", (long) client);
    return reinterpret_cast<jlong>(client);
}


extern "C" JNIEXPORT int JNICALL
Java_me_linjw_lib_lame_LameMp3_close(
        JNIEnv *env,
        jobject thiz,
        jlong clientPtr) {
    lame_global_flags *client = reinterpret_cast<lame_global_flags *>(clientPtr);
    LOGD("close(%ld)", client);
    return lame_close(client);
}

詳細代碼參考LameMp3.ktnative-lib.cpp

DEMO代碼

DEMO代碼已經放到github

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章