Qt/C++音視頻開發46-音視頻同步保存到MP4

一、前言

用ffmpeg單獨做視頻保存不難，單獨做音頻保存也不難，難的是音視頻同步保存到MP4中，重點是音視頻要同步，其實這也不難，只要播放那邊音視頻同步後的數據，寫入到文件即可。最難的是在播放過程中不斷隨機的切換播放進度，而且還會暫停播放、暫停錄製的情況出現，這些個複雜情況的出現，可以說，測試了所有網絡上可能找到的相關代碼，沒有一個是行得通的，基本上都是停留在最簡單的處理。那怎麼辦呢？近期花了半個月的時間，閉門把這個硬骨頭啃下來，專門處理這個問題，畢竟暫停播放、暫停錄製、切換進度這些個情況都是極大概率發生的，這一關過不了，就無法號稱最全播放組件了。總之核心的解決辦法就是，除了要重新調整時間基準以外，還需要在前面重新按照幀數量和音頻的時長來設置pts/dts，網上能找到的代碼，幾乎都沒看到這個計算，幾乎都是調整時間基準的。大致整理了下能夠做到下面幾點的才能基本合格。

網上的保存計算都是在理想狀態下進行的(打開後從第一幀開始保存直到結束)
中間如果切換了播放進度(不是連續的幀)
中間暫停了流採集或者暫停了錄製(不是連續的時間)
同時支持錄製到文件和推流到服務器
音視頻同步輸出(任意切換進度自動同步)
指定只存儲視頻或者音頻
音視頻流索引順序是0/1和1/0
不編碼存儲和重新編碼存儲

爲何要區分不編碼存儲和重新編碼存儲？以爲編碼要佔用cpu，對於源頭就是H264/265/AAC這種，完全可以不用編碼直接存儲到MP4文件中，可以大大節約CPU資源，所以保存類的設計中，就應該有這個判斷。

二、效果圖

三、體驗地址

國內站點：https://gitee.com/feiyangqingyun
國際站點：https://github.com/feiyangqingyun
個人作品：https://blog.csdn.net/feiyangqingyun/article/details/97565652
體驗地址：https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼：01jf 文件名：bin_video_demo。

四、功能特點

4.1 基礎功能

支持各種音頻視頻文件格式，比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
支持本地攝像頭設備，可指定分辨率、幀率。
支持各種視頻流格式，比如rtp、rtsp、rtmp、http等。
本地音視頻文件和網絡音視頻文件，自動識別文件長度、播放進度、音量大小、靜音狀態等。
文件可以指定播放位置、調節音量大小、設置靜音狀態等。
支持倍速播放文件，可選0.5倍、1.0倍、2.5倍、5.0倍等速度，相當於慢放和快放。
支持開始播放、停止播放、暫停播放、繼續播放。
支持抓拍截圖，可指定文件路徑，可選抓拍完成是否自動顯示預覽。
支持錄像存儲，手動開始錄像、停止錄像，部分內核支持暫停錄像後繼續錄像，跳過不需要錄像的部分。
支持無感知切換循環播放、自動重連等機制。
提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態變化等信號。
多線程處理，一個解碼一個線程，不卡主界面。

4.2 特色功能

同時支持多種解碼內核，包括qmedia內核（Qt4/Qt5/Qt6）、ffmpeg內核（ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5）、vlc內核（vlc2/vlc3）、mpv內核（mpv1/mp2）、監控廠家sdk內核等。
非常完善的多重基類設計，新增一種解碼內核只需要實現極少的代碼量，就可以應用整套機制。
同時支持多種畫面顯示策略，自動調整（原始分辨率小於顯示控件尺寸則按照原始分辨率大小顯示，否則等比例縮放）、等比例縮放（永遠等比例縮放）、拉伸填充（永遠拉伸填充）。所有內核和所有視頻顯示模式下都支持三種畫面顯示策略。
同時支持多種視頻顯示模式，句柄模式（傳入控件句柄交給對方繪製控制）、繪製模式（回調拿到數據後轉成QImage用QPainter繪製）、GPU模式（回調拿到數據後轉成yuv用QOpenglWidget繪製）。
支持多種硬件加速類型，ffmpeg可選dxva2、d3d11va等，mpv可選auto、dxva2、d3d11va，vlc可選any、dxva2、d3d11va。不同的系統環境有不同的類型選擇，比如linux系統有vaapi、vdpau，macos系統有videotoolbox。
解碼線程和顯示窗體分離，可指定任意解碼內核掛載到任意顯示窗體，動態切換。
支持共享解碼線程，默認開啓並且自動處理，當識別到相同的視頻地址，共享一個解碼線程，在網絡視頻環境中可以大大節約網絡流量以及對方設備的推流壓力。國內頂尖視頻廠商均採用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
自動識別視頻旋轉角度並繪製，比如手機上拍攝的視頻一般是旋轉了90度的，播放的時候要自動旋轉處理，不然默認是倒着的。
自動識別視頻流播放過程中分辨率的變化，在視頻控件上自動調整尺寸。比如攝像機可以在使用過程中動態配置分辨率，當分辨率改動後對應視頻控件也要做出同步反應。
音視頻文件無感知自動切換循環播放，不會出現切換期間黑屏等肉眼可見的切換痕跡。
視頻控件同時支持任意解碼內核、任意畫面顯示策略、任意視頻顯示模式。
視頻控件懸浮條同時支持句柄、繪製、GPU三種模式，非絕對座標移來移去。
本地攝像頭設備支持指定設備名稱、分辨率、幀率進行播放。
錄像文件同時支持打開的視頻文件、本地攝像頭、網絡視頻流等。
瞬間響應打開和關閉，無論是打開不存在的視頻或者網絡流，探測設備是否存在，讀取中的超時等待，收到關閉指令立即中斷之前的操作並響應。
支持打開各種圖片文件，支持本地音視頻文件拖曳播放。
視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視頻等功能。
音頻組件支持聲音波形值數據解析，可以根據該值繪製波形曲線和柱狀聲音條，默認提供了聲音振幅信號。
代碼框架和結構優化到極致，性能彪悍，持續迭代更新升級。
源碼支持Qt4、Qt5、Qt6，兼容所有版本。

4.3 視頻控件

可動態添加任意多個osd標籤信息，標籤信息包括名字、是否可見、字號大小、文本文字、文本顏色、標籤圖片、標籤座標、標籤格式（文本、日期、時間、日期時間、圖片）、標籤位置（左上角、左下角、右上角、右下角、居中、自定義座標）。
可動態添加任意多個圖形信息，這個非常有用，比如人工智能算法解析後的圖形區域信息直接發給視頻控件即可。圖形信息支持任意形狀，直接繪製在原始圖片上，採用絕對座標。
圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區域、路徑集合、點座標集合等。
每個圖形信息都可指定三種區域中的一種或者多種，指定了的都會繪製。
內置懸浮條控件，懸浮條位置支持頂部、底部、左側、右側。
懸浮條控件參數包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
懸浮條控件一排工具按鈕可自定義，通過結構體參數設置，圖標可選圖形字體還是自定義圖片。
懸浮條按鈕內部實現了錄像切換、抓拍截圖、靜音切換、關閉視頻等功能，也可以自行在源碼中增加自己對應的功能。
懸浮條按鈕對應實現了功能的按鈕，有對應圖標切換處理，比如錄像按鈕按下後會切換到正在錄像中的圖標，聲音按鈕切換後變成靜音圖標，再次切換還原。
懸浮條按鈕單擊後都用名稱唯一標識作爲信號發出，可以自行關聯響應處理。
懸浮條空白區域可以顯示提示信息，默認顯示當前視頻分辨率大小，可以增加幀率、碼流大小等信息。
視頻控件參數包括邊框大小、邊框顏色、焦點顏色、背景顏色（默認透明）、文字顏色（默認全局文字顏色）、填充顏色（視頻外的空白處填充黑色）、背景文字、背景圖片（如果設置了圖片優先取圖片）、是否拷貝圖片、縮放顯示模式（自動調整、等比例縮放、拉伸填充）、視頻顯示模式（句柄、繪製、GPU）、啓用懸浮條、懸浮條尺寸（橫向爲高度、縱向爲寬度）、懸浮條位置（頂部、底部、左側、右側）。

4.4 內核ffmpeg

支持各種音視頻文件、本地攝像頭設備，各種視頻流網絡流。
支持開始播放、暫停播放、繼續播放、停止播放、設置播放進度、倍速播放。
可設置音量、靜音切換、抓拍圖片、錄像存儲。
自動提取專輯信息比如標題、藝術家、專輯、專輯封面，自動顯示專輯封面。
完美支持音視頻同步和倍速播放。
解碼策略支持速度優先、質量優先、均衡處理、最快速度。
支持手機視頻旋轉角度顯示，比如一般手機拍攝的視頻是旋轉了90度的，解碼顯示的時候需要重新旋轉90度纔是正的。
自動轉換yuv420格式，比如本地攝像頭是yuyv422格式，有些視頻文件是xx格式，統一將非yuv420格式轉換，然後再進行處理。
支持硬解碼dxva2、d3d11va等，性能極高尤其是大分辨率比如4K視頻。
視頻響應極低延遲0.2s左右，極速響應打開視頻流0.5s左右，專門做了優化處理。
硬解碼和GPU繪製組合，極低CPU佔用，比海康大華等客戶端更優。
支持視頻流中的各種音頻格式，AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持，推薦選擇AAC兼容性跨平臺性最好。
視頻存儲支持yuv、h264、mp4多種格式，音頻存儲支持pcm、wav、aac多種格式。默認視頻mp4格式、音頻aac格式。
支持分開存儲音頻視頻文件，也支持合併到一個mp4文件，默認策略是無論何種音視頻文件格式存儲，最終都轉成mp4及aac格式，然後合併成音視頻一起的mp4文件。
支持本地攝像頭實時視頻顯示帶音頻輸入輸出，音視頻錄製合併到一個mp4文件。
支持H265編碼（現在越來越多的監控攝像頭是H265視頻流格式）生成視頻文件，內部自動識別切換編碼格式。
自動識別視頻流動態分辨率改動，重新打開視頻流。
純qt+ffmpeg解碼，非sdl等第三方繪製播放依賴，gpu繪製採用qopenglwidget，音頻播放採用qaudiooutput。
同時支持ffmpeg2、ffmpeg3、ffmpeg4、ffmpeg5版本，全部做了兼容處理。如果需要支持xp需要選用ffmpeg3及以下。

五、相關代碼

void FFmpegSaveSimple::run()
{
    if (!this->open()) {
        this->close();
        return;
    }

    int ret;
    AVPacket packet;
    qint64 videoCount = 0;
    qint64 startTime = av_gettime();

    while (!stopped) {
        //讀取一幀
        ret = av_read_frame(formatCtxIn, &packet);
        int index = packet.stream_index;
        if (ret < 0) {
            if (ret == AVERROR_EOF || ret == AVERROR_EXIT) {
                debug(ret, "文件結束");
                break;
            } else {
                debug(ret, "讀取出錯");
                continue;
            }
        }

        //取出輸入輸出流的時間基
        AVStream *streamIn = formatCtxIn->streams[index];
        AVStream *streamOut = formatCtxOut->streams[index];
        AVRational timeBaseIn = streamIn->time_base;
        AVRational timeBaseOut = streamOut->time_base;

        if (index == videoIndex) {
            videoCount++;
        }

        //糾正有些文件比如h264格式的沒有pts
        if (packet.pts == AV_NOPTS_VALUE) {
            qreal fps = av_q2d(formatCtxIn->streams[videoIndex]->r_frame_rate);
            FFmpegHelper::rescalePacket(&packet, timeBaseIn, videoCount, fps);
        }

        //延時(防止數據太快給緩存造成太大壓力)
        if (index == videoIndex) {
            AVRational timeBase = {1, AV_TIME_BASE};
            int64_t ptsTime = av_rescale_q(packet.dts, timeBaseIn, timeBase);
            int64_t nowTime = av_gettime() - startTime;
            if (ptsTime > nowTime) {
                av_usleep(ptsTime - nowTime);
            }
        }

        //重新調整時間基準
        FFmpegHelper::rescalePacket(&packet, timeBaseIn, timeBaseOut);

        qDebug() << TIMEMS << "發送一幀" << videoCount << packet.flags << packet.pts << packet.dts;
        //ret = av_write_frame(formatCtxOut, &packet);
        ret = av_interleaved_write_frame(formatCtxOut, &packet);
        if (ret < 0) {
            debug(ret, "寫數據包");
            break;
        }

        av_packet_unref(&packet);
    }

    //寫文件尾
    av_write_trailer(formatCtxOut);
    this->close();
}

void FFmpegHelper::rescalePacket(AVPacket *packet, AVRational timeBaseIn, qint64 &count, qreal fps)
{
    count++;
    qreal duration = AV_TIME_BASE / fps;
    packet->pts = (count * duration) / (av_q2d(timeBaseIn) * AV_TIME_BASE);
    packet->dts = packet->pts;
    packet->duration = duration / (av_q2d(timeBaseIn) * AV_TIME_BASE);
}

void FFmpegHelper::rescalePacket(AVPacket *packet, AVRational timeBaseIn, AVRational timeBaseOut)
{
    //1. av_rescale_q裏面調用的av_rescale_q_rnd
    //2. av_rescale_q_rnd裏面調用的av_rescale_rnd
    //3. av_packet_rescale_ts對pts/dts/duration三者調用av_rescale_q
#if 1
    packet->pts = av_rescale_q_rnd(packet->pts, timeBaseIn, timeBaseOut, AVRounding(AV_ROUND_NEAR_INF | AV_ROUND_PASS_MINMAX));
    packet->dts = av_rescale_q_rnd(packet->dts, timeBaseIn, timeBaseOut, AVRounding(AV_ROUND_NEAR_INF | AV_ROUND_PASS_MINMAX));
    packet->duration = av_rescale_q(packet->duration, timeBaseIn, timeBaseOut);
#else
    av_packet_rescale_ts(packet, timeBaseIn, timeBaseOut);
#endif
    packet->pos = -1;
}

void FFmpegHelper::rescalePacket(AVPacket *packet, AVRational timeBaseIn, AVRational timeBaseOut, qint64 &duration)
{
    //qDebug() << TIMEMS << duration << packet->duration << timeBaseIn.den << timeBaseIn.num << timeBaseOut.den << timeBaseOut.num;
    packet->pts = av_rescale_q_rnd(duration, timeBaseIn, timeBaseOut, AV_ROUND_UP);
    packet->dts = packet->pts;//av_rescale_q_rnd(duration, timeBaseIn, timeBaseOut, AV_ROUND_UP);
    //packet->duration = av_rescale_q_rnd(packet->duration, timeBaseIn, timeBaseOut,AV_ROUND_UP);
    packet->pos = -1;
    duration += packet->duration;
}

Qt/C++音視頻開發46-音視頻同步保存到MP4

一、前言

二、效果圖

三、體驗地址

四、功能特點

4.1 基礎功能

4.2 特色功能

4.3 視頻控件

4.4 內核ffmpeg

五、相關代碼

Android啓動過程-萬字長文(Android14)

【SQL進階】CASE語句的使用

optional install error: Error: Unsupported URL Type: npm:vue-loader@^16.1.0

這種嵌套字典類型的數據，我想把它讀取到df裏，如何操作？

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺

iNeuOS工業互聯網操作系統，增加電力IEC104協議

微服務實踐k8s&dapr開發部署實驗（3）訂閱發佈

chromedriver版本

kbgressdb之數據結構V0.2

Qt/C++音視頻開發75-獲取本地有哪些攝像頭名稱/Qt內置函數方式

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

Qt/C++音視頻開發73-高效濾鏡/文字水印/圖形水印/圖片水印/yolo運算後的結果顯示到畫面中

Qt/C++音視頻開發72-倍速推流/音視頻同步倍速推流/不改變幀率和採樣率/低倍速和高倍速

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結