Qt/C++音視頻開發66-音頻變速不變調/重採樣/提高音量/變速變調/倍速播放/sonic庫使用

一、前言

之前在做倍速這個功能的時候，發現快速播放會有滴滴滴的破音出現，正常1倍速沒有這個問題，儘管這個破音間隔很短，要放大音量才能聽到，但是總歸是不完美的，後面發現，通過修改qaudiooutput的採樣率，可以規避這個問題，破音不在出現了，但是音調變了，倍速越大變得越快，人聲越發不清晰，變得尖銳，也就是通常說的變速變調了。當然這是正常現象，所有搞音視頻播放開發者都會遇到這個現象，因爲這就是默認的正常現象，但是我們希望聽到的是變速不變調，速度可以快，但是要儘量保持人聲能夠識別。所以就需要有個算法能夠將收到的可以直接播放的pcm數據運算，運算後的pcm數據是儘量保證了人聲的數據，這樣保持採樣率不變的情況下，播放出來的聲音效果非常好。

對比過很多播放器，有些著名的播放器早期也是沒有考慮到這個變速變調的問題，是後來的版本才慢慢加上去的。還有些著名的組件比如qtav等，也一直是沒有解決變速變調的問題，包括著名的推流大佬obs，調整到2倍速推流，聲音也是變調了的。通過查閱資料得知，保證變速不變調，通常用兩個庫來實現，一個是soundtouch，一個是sonic，本人更喜歡用sonic，集成簡單，就一個h和一個c文件，純c語言編寫的，整個源碼就幾千行代碼。要學習也是非常容易的，通用任何平臺和編譯器。畢竟就是個數學運算庫，只要是能支持C語言的場景就都支持。

Qt調用sonic庫基本步驟：

創建對象 sonicCreateStream，傳入採樣率和通道。
設置倍速 sonicSetSpeed，還可以設置音調sonicSetPitch、設置語速sonicSetRate等。
寫入數據 sonicWriteShortToStream，將收到的可以直接播放的pcm音頻數據傳入。
取出數據 sonicReadShortFromStream，將取出的數據再發給qaudiooutput播放即可。

視頻演示步驟：

演示不做任何處理的倍速聲音。
演示通過更改採樣率的倍速聲音。
演示通過音效庫處理的聲音。
演示音調變化，正常語速，變化音調。
演示音量變化，正常音量，通過修改聲音數據，強制提高音量。
演示麥克風正常語速變調，不同通道。
對比vlc、mpv、qtav的倍速處理。
在其他系統上編譯測試是否也都兼容。

二、效果圖

三、體驗地址

國內站點：https://gitee.com/feiyangqingyun
國際站點：https://github.com/feiyangqingyun
個人作品：https://blog.csdn.net/feiyangqingyun/article/details/97565652
體驗地址：https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼：01jf 文件名：bin_video_demo。
視頻主頁：https://space.bilibili.com/687803542

四、功能特點

4.1. 基礎功能

支持各種音頻視頻文件格式，比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
支持本地攝像頭設備和本地桌面採集，支持多設備和多屏幕。
支持各種視頻流格式，比如rtp、rtsp、rtmp、http、udp等。
本地音視頻文件和網絡音視頻文件，自動識別文件長度、播放進度、音量大小、靜音狀態等。
文件可以指定播放位置、調節音量大小、設置靜音狀態等。
支持倍速播放文件，可選0.5倍、1.0倍、2.5倍、5.0倍等速度，相當於慢放和快放。
支持開始播放、停止播放、暫停播放、繼續播放。
支持抓拍截圖，可指定文件路徑，可選抓拍完成是否自動顯示預覽。
支持錄像存儲，手動開始錄像、停止錄像，部分內核支持暫停錄像後繼續錄像，跳過不需要錄像的部分。
支持無感知切換循環播放、自動重連等機制。
提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態變化等信號。
多線程處理，一個解碼一個線程，不卡主界面。

4.2. 特色功能

同時支持多種解碼內核，包括qmedia內核（Qt4/Qt5/Qt6）、ffmpeg內核（ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5/ffmpeg6）、vlc內核（vlc2/vlc3）、mpv內核（mpv1/mp2）、mdk內核、海康sdk、easyplayer內核等。
非常完善的多重基類設計，新增一種解碼內核只需要實現極少的代碼量，就可以應用整套機制，極易拓展。
同時支持多種畫面顯示策略，自動調整（原始分辨率小於顯示控件尺寸則按照原始分辨率大小顯示，否則等比縮放）、等比縮放（永遠等比縮放）、拉伸填充（永遠拉伸填充）。所有內核和所有視頻顯示模式下都支持三種畫面顯示策略。
同時支持多種視頻顯示模式，句柄模式（傳入控件句柄交給對方繪製控制）、繪製模式（回調拿到數據後轉成QImage用QPainter繪製）、GPU模式（回調拿到數據後轉成yuv用QOpenglWidget繪製）。
支持多種硬件加速類型，ffmpeg可選dxva2、d3d11va等，vlc可選any、dxva2、d3d11va，mpv可選auto、dxva2、d3d11va，mdk可選dxva2、d3d11va、cuda、mft等。不同的系統環境有不同的類型選擇，比如linux系統有vaapi、vdpau，macos系統有videotoolbox。
解碼線程和顯示窗體分離，可指定任意解碼內核掛載到任意顯示窗體，動態切換。
支持共享解碼線程，默認開啓並且自動處理，當識別到相同的視頻地址，共享一個解碼線程，在網絡視頻環境中可以大大節約網絡流量以及對方設備的推流壓力。國內頂尖視頻廠商均採用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
自動識別視頻旋轉角度並繪製，比如手機上拍攝的視頻一般是旋轉了90度的，播放的時候要自動旋轉處理，不然默認是倒着的。
自動識別視頻流播放過程中分辨率的變化，在視頻控件上自動調整尺寸。比如攝像機可以在使用過程中動態配置分辨率，當分辨率改動後對應視頻控件也要做出同步反應。
音視頻文件無感知自動切換循環播放，不會出現切換期間黑屏等肉眼可見的切換痕跡。
視頻控件同時支持任意解碼內核、任意畫面顯示策略、任意視頻顯示模式。
視頻控件懸浮條同時支持句柄、繪製、GPU三種模式，非絕對座標移來移去。
本地攝像頭設備支持指定設備名稱、分辨率、幀率進行播放。
本地桌面採集支持設定採集區域、偏移值、指定桌面索引、幀率、多個桌面同時採集等。還支持指定窗口標題採集固定窗口。
錄像文件同時支持打開的視頻文件、本地攝像頭、本地桌面、網絡視頻流等。
瞬間響應打開和關閉，無論是打開不存在的視頻或者網絡流，探測設備是否存在，讀取中的超時等待，收到關閉指令立即中斷之前的操作並響應。
支持打開各種圖片文件，支持本地音視頻文件拖曳播放。
視頻流通信方式可選tcp/udp，有些設備可能只提供了某一種協議通信比如tcp，需要指定該種協議方式打開。
可設置連接超時時間（視頻流探測用的超時時間）、讀取超時時間（採集過程中的超時時間）。
支持逐幀播放，提供上一幀/下一幀函數接口，可以逐幀查閱採集到的圖像。
音頻文件自動提取專輯信息比如標題、藝術家、專輯、專輯封面，自動顯示專輯封面。
視頻響應極低延遲0.2s左右，極速響應打開視頻流0.5s左右，專門做了優化處理。
支持H264/H265編碼（現在越來越多的監控攝像頭是H265視頻流格式）生成視頻文件，內部自動識別切換編碼格式。
支持用戶信息中包含特殊字符（比如用戶信息中包含+#@等字符）的視頻流播放，內置解析轉義處理。
支持濾鏡，各種水印及圖形效果，支持多個水印和圖像，可以將OSD標籤信息和各種圖形信息寫入到MP4文件。
支持視頻流中的各種音頻格式，AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持，推薦選擇AAC兼容性跨平臺性最好。
內核ffmpeg採用純qt+ffmpeg解碼，非sdl等第三方繪製播放依賴，gpu繪製採用qopenglwidget，音頻播放採用qaudiooutput。
內核ffmpeg和內核mdk支持安卓，其中mdk支持安卓硬解碼，性能非常兇殘。
可以切換音視頻軌道，也就是節目通道，可能ts文件帶了多個音視頻節目流，可以分別設置要播放哪一個，可以播放前設置好和播放過程中動態設置。
可以設置視頻旋轉角度，可以播放前設置好和播放過程中動態改變。
視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視頻等功能。
音頻組件支持聲音波形值數據解析，可以根據該值繪製波形曲線和柱狀聲音條，默認提供了聲音振幅信號。
標籤和圖形信息支持三種繪製方式，繪製到遮罩層、繪製到圖片、源頭繪製（對應信息可以存儲到文件）。
通過傳入一個url地址，該地址可以帶上通信協議、分辨率、幀率等信息，無需其他設置。
保存視頻到文件支持三種策略，自動處理、僅限文件、全部轉碼，轉碼策略支持自動識別、轉264、轉265，編碼保存支持指定分辨率縮放或者等比例縮放。比如對保存文件體積有要求可以指定縮放後再存儲。
支持加密保存文件和解密播放文件，可以指定祕鑰文本。
提供的監控佈局類支持64通道同時顯示，還支持各種異型佈局，比如13通道，手機上6行2列布局。各種佈局可以自由定義。
支持電子放大，在懸浮條切換到電子放大模式，在畫面上選擇需要放大的區域，選取完畢後自動放大，再次切換放大模式可以復位。
各組件中極其詳細的打印信息提示，尤其是報錯信息提示，封裝的統一打印格式。針對現場複雜的設備環境測試極其方便有用，相當於精確定位到具體哪個通道哪個步驟出錯。
同時提供了簡單示例、視頻播放器、多畫面視頻監控、監控回放、逐幀播放、多屏渲染等單獨窗體示例，專門演示對應功能如何使用。
監控回放可選不同廠家類型、回放時間段、用戶信息、指定通道。支持切換回放進度。
可以從聲卡設備下拉框選擇聲卡播放聲音，提供對應的切換聲卡函數接口。
支持編譯到手機app使用，提供了專門的手機app佈局界面，可以作爲手機上的視頻監控使用。
代碼框架和結構優化到最優，性能強悍，註釋詳細，持續迭代更新升級。
源碼支持windows、linux、mac、android等，支持各種國產linux系統，包括但不限於統信UOS/中標麒麟/銀河麒麟等。還支持嵌入式linux。
源碼支持Qt4、Qt5、Qt6，兼容所有版本。

4.3. 視頻控件

可動態添加任意多個osd標籤信息，標籤信息包括名字、是否可見、字號大小、文本文字、文本顏色、背景顏色、標籤圖片、標籤座標、標籤格式（文本、日期、時間、日期時間、圖片）、標籤位置（左上角、左下角、右上角、右下角、居中、自定義座標）。
可動態添加任意多個圖形信息，這個非常有用，比如人工智能算法解析後的圖形區域信息直接發給視頻控件即可。圖形信息支持任意形狀，直接繪製在原始圖片上，採用絕對座標。
圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區域、路徑集合、點座標集合等。
每個圖形信息都可指定三種區域中的一種或者多種，指定了的都會繪製。
內置懸浮條控件，懸浮條位置支持頂部、底部、左側、右側。
懸浮條控件參數包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
懸浮條控件一排工具按鈕可自定義，通過結構體參數設置，圖標可選圖形字體還是自定義圖片。
懸浮條按鈕內部實現了錄像切換、抓拍截圖、靜音切換、關閉視頻等功能，也可以自行在源碼中增加自己對應的功能。
懸浮條按鈕對應實現了功能的按鈕，有對應圖標切換處理，比如錄像按鈕按下後會切換到正在錄像中的圖標，聲音按鈕切換後變成靜音圖標，再次切換還原。
懸浮條按鈕單擊後都用名稱唯一標識作爲信號發出，可以自行關聯響應處理。
懸浮條空白區域可以顯示提示信息，默認顯示當前視頻分辨率大小，可以增加幀率、碼流大小等信息。
視頻控件參數包括邊框大小、邊框顏色、焦點顏色、背景顏色（默認透明）、文字顏色（默認全局文字顏色）、填充顏色（視頻外的空白處填充黑色）、背景文字、背景圖片（如果設置了圖片優先取圖片）、是否拷貝圖片、縮放顯示模式（自動調整、等比縮放、拉伸填充）、視頻顯示模式（句柄、繪製、GPU）、啓用懸浮條、懸浮條尺寸（橫向爲高度、縱向爲寬度）、懸浮條位置（頂部、底部、左側、右側）。

五、相關代碼

void AudioPlayer::openSonic(bool useSonic, int sampleRate, int channelCount, float speed, float pitch, float rate, float volume)
{
    this->closeSonic();
    if (useSonic) {
        //開闢臨時存放運算後的音頻數據內存空間
        sonicData = new float[sonicSize];
        //創建變速運算流
        sonicObj = SonicCpp::sonicCreateStream(sampleRate, channelCount);
        //設置音速
        SonicCpp::sonicSetSpeed(sonicObj, speed);
        //設置音調
        SonicCpp::sonicSetPitch(sonicObj, pitch);
        //設置語速
        SonicCpp::sonicSetRate(sonicObj, rate);
        //聲音大小/可以通過改變聲音數據強制提高音量
        SonicCpp::sonicSetVolume(sonicObj, volume);
    }
}

void AudioPlayer::closeSonic()
{
    //釋放變聲庫臨時數據
    if (sonicData) {
        delete[] sonicData;
        sonicData = NULL;
    }

    //釋放變聲庫對象
    if (sonicObj) {
        SonicCpp::sonicDestroyStream(sonicObj);
        sonicObj = NULL;
    }
}

void AudioPlayer::playSonicData(const char *data, qint64 len)
{
    //爲什麼是這個尺寸 https://blog.csdn.net/qq_40170041/article/details/127727153
    //寫入的時候用真實的數據長度除以這個值/取出的時候用運算後的真實數據長度乘以這個值
    //先將音頻數據寫入流/然後從流中取出運算後的數據
    int offset, numSamples;
    if (sampleSize == 8) {
        offset = SonicCpp::sonicGetNumChannels(sonicObj) * 1;
        SonicCpp::sonicWriteUnsignedCharToStream(sonicObj, (uchar *)data, len / offset);
        numSamples = SonicCpp::sonicReadUnsignedCharFromStream(sonicObj, (uchar *)sonicData, sonicSize);
    } else if (sampleSize == 16) {
        offset = SonicCpp::sonicGetNumChannels(sonicObj) * 2;
        SonicCpp::sonicWriteShortToStream(sonicObj, (short *)data, len / offset);
        numSamples = SonicCpp::sonicReadShortFromStream(sonicObj, (short *)sonicData, sonicSize);
    } else {
        offset = SonicCpp::sonicGetNumChannels(sonicObj) * 4;
        SonicCpp::sonicWriteFloatToStream(sonicObj, (float *)data, len / offset);
        numSamples = SonicCpp::sonicReadFloatFromStream(sonicObj, (float *)sonicData, sonicSize);
    }

    //寫入運算後的音頻數據
    deviceOutput->write((const char *)sonicData, numSamples * offset);
}

void AudioPlayer::playAudioData(const char *data, qint64 len)
{
#ifdef multimedia
    if (deviceOutput) {
        //發送收到音頻播放數據信號
        emit receiveOutputData(data, len);
        //限定靜音狀態下不寫入數據減輕壓力
        if (!muted) {
            if (sonicObj) {
                this->playSonicData(data, len);
            } else {
                deviceOutput->write(data, len);
            }
        }

        //獲取音頻數據振幅
        if (level) {
            qreal leftLevel, rightLevel;
            AudioHelper::getAudioLevel(audioOutput->format(), data, len, leftLevel, rightLevel);
            emit receiveLevel(leftLevel, rightLevel);
        }
    }
#endif
}

Qt/C++音視頻開發66-音頻變速不變調/重採樣/提高音量/變速變調/倍速播放/sonic庫使用

一、前言

二、效果圖

三、體驗地址

四、功能特點

4.1. 基礎功能

4.2. 特色功能

4.3. 視頻控件

五、相關代碼

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

Qt程序員必看/關於Qt收費的官方答覆

這可能是國內Qt/C++界最受歡迎開源項目之一/5.8Kstar/持續迭代更新

Qt/C++通用跨平臺Onvif工具/支持海康大華宇視華爲天地偉業等/雲臺控制/預置位管理/工程調試利器

Qt/C++監控推流設備推流/延遲極低/實時性極高/rtsp/rtmp推流/hls/flv/webrtc拉流/調整分辨率降低帶寬

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結