Qt音視頻開發47-文字和圖片水印（可存儲到MP4中）

一、前言

近期花了兩週時間閉門啃硬骨頭，主要就解決三個問題（音視頻同步存儲和推流、圖片水印並將水印信息存儲到文件或者推流、rtsp推流），這三個問題困擾了很多年，以至於找遍了網絡和翻遍ffplay代碼以及ffmpeg示例的代碼，通過不下於上百次方案的調整和測試，幾乎每次都是在接近崩潰的時候，靈機一動就成了，能存儲成功基本上就能推流成功，畢竟推流就是將存儲的文件地址改成推流地址就行。

在ffmpeg中除了編解碼以外，濾鏡應該就是第二強大的功能，縱觀現在市面上各種視頻處理軟件中的特效，幾乎都是底層用ffmpeg去處理的，因爲ffmpeg中的濾鏡處理可以從源頭上解決問題，他可以直接應用好特效後更改幀數據，這樣收到的幀就已經是帶了特效的幀，意味着保存的時候也就是帶了水印和特效的幀，當然濾鏡越多佔用CPU越高，一般不建議過多的特效，比如文字水印控制在4個，圖片水印控制在2個，其中文字水印支持換行顯示，對標vlc和mpv中的水印，也是固定支持2-4路，超過了也沒有。

很早以前就把ffmpeg中的文字水印搞定了，包括了各種方框圖形、模糊濾鏡等，唯獨圖片濾鏡沒搞定，單獨用movie濾鏡設置一個圖片水印是可以的，但是和文字水印以及其他水印一組合，就歇菜了，導致所有水印失效，在avfilter_graph_parse_ptr會報錯，其他的濾鏡只需要將濾鏡內容用逗號隔開就行，而圖片濾鏡就是不行，後面想着是不是要創建多個avfilter中的in來處理，也不行，而且也有點多餘，查閱了各種資料，尤其是官網的信息，終於找到問題所在，原來一旦加了圖片濾鏡，整個濾鏡字符串的格式和排列就需要做特殊調整，而且貌似順序有要求，必須是其他各種濾鏡字符串組合在前面，圖片濾鏡在最後面。

二、效果圖

三、體驗地址

國內站點：https://gitee.com/feiyangqingyun
國際站點：https://github.com/feiyangqingyun
個人作品：https://blog.csdn.net/feiyangqingyun/article/details/97565652
體驗地址：https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼：01jf 文件名：bin_video_demo。

四、功能特點

4.1 基礎功能

支持各種音頻視頻文件格式，比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
支持本地攝像頭設備，可指定分辨率、幀率。
支持各種視頻流格式，比如rtp、rtsp、rtmp、http等。
本地音視頻文件和網絡音視頻文件，自動識別文件長度、播放進度、音量大小、靜音狀態等。
文件可以指定播放位置、調節音量大小、設置靜音狀態等。
支持倍速播放文件，可選0.5倍、1.0倍、2.5倍、5.0倍等速度，相當於慢放和快放。
支持開始播放、停止播放、暫停播放、繼續播放。
支持抓拍截圖，可指定文件路徑，可選抓拍完成是否自動顯示預覽。
支持錄像存儲，手動開始錄像、停止錄像，部分內核支持暫停錄像後繼續錄像，跳過不需要錄像的部分。
支持無感知切換循環播放、自動重連等機制。
提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態變化等信號。
多線程處理，一個解碼一個線程，不卡主界面。

4.2 特色功能

同時支持多種解碼內核，包括qmedia內核（Qt4/Qt5/Qt6）、ffmpeg內核（ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5）、vlc內核（vlc2/vlc3）、mpv內核（mpv1/mp2）、監控廠家sdk內核等。
非常完善的多重基類設計，新增一種解碼內核只需要實現極少的代碼量，就可以應用整套機制。
同時支持多種畫面顯示策略，自動調整（原始分辨率小於顯示控件尺寸則按照原始分辨率大小顯示，否則等比例縮放）、等比例縮放（永遠等比例縮放）、拉伸填充（永遠拉伸填充）。所有內核和所有視頻顯示模式下都支持三種畫面顯示策略。
同時支持多種視頻顯示模式，句柄模式（傳入控件句柄交給對方繪製控制）、繪製模式（回調拿到數據後轉成QImage用QPainter繪製）、GPU模式（回調拿到數據後轉成yuv用QOpenglWidget繪製）。
支持多種硬件加速類型，ffmpeg可選dxva2、d3d11va等，mpv可選auto、dxva2、d3d11va，vlc可選any、dxva2、d3d11va。不同的系統環境有不同的類型選擇，比如linux系統有vaapi、vdpau，macos系統有videotoolbox。
解碼線程和顯示窗體分離，可指定任意解碼內核掛載到任意顯示窗體，動態切換。
支持共享解碼線程，默認開啓並且自動處理，當識別到相同的視頻地址，共享一個解碼線程，在網絡視頻環境中可以大大節約網絡流量以及對方設備的推流壓力。國內頂尖視頻廠商均採用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
自動識別視頻旋轉角度並繪製，比如手機上拍攝的視頻一般是旋轉了90度的，播放的時候要自動旋轉處理，不然默認是倒着的。
自動識別視頻流播放過程中分辨率的變化，在視頻控件上自動調整尺寸。比如攝像機可以在使用過程中動態配置分辨率，當分辨率改動後對應視頻控件也要做出同步反應。
音視頻文件無感知自動切換循環播放，不會出現切換期間黑屏等肉眼可見的切換痕跡。
視頻控件同時支持任意解碼內核、任意畫面顯示策略、任意視頻顯示模式。
視頻控件懸浮條同時支持句柄、繪製、GPU三種模式，非絕對座標移來移去。
本地攝像頭設備支持指定設備名稱、分辨率、幀率進行播放。
錄像文件同時支持打開的視頻文件、本地攝像頭、網絡視頻流等。
瞬間響應打開和關閉，無論是打開不存在的視頻或者網絡流，探測設備是否存在，讀取中的超時等待，收到關閉指令立即中斷之前的操作並響應。
支持打開各種圖片文件，支持本地音視頻文件拖曳播放。
視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視頻等功能。
音頻組件支持聲音波形值數據解析，可以根據該值繪製波形曲線和柱狀聲音條，默認提供了聲音振幅信號。
代碼框架和結構優化到極致，性能彪悍，持續迭代更新升級。
源碼支持Qt4、Qt5、Qt6，兼容所有版本。

4.3 視頻控件

可動態添加任意多個osd標籤信息，標籤信息包括名字、是否可見、字號大小、文本文字、文本顏色、標籤圖片、標籤座標、標籤格式（文本、日期、時間、日期時間、圖片）、標籤位置（左上角、左下角、右上角、右下角、居中、自定義座標）。
可動態添加任意多個圖形信息，這個非常有用，比如人工智能算法解析後的圖形區域信息直接發給視頻控件即可。圖形信息支持任意形狀，直接繪製在原始圖片上，採用絕對座標。
圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區域、路徑集合、點座標集合等。
每個圖形信息都可指定三種區域中的一種或者多種，指定了的都會繪製。
內置懸浮條控件，懸浮條位置支持頂部、底部、左側、右側。
懸浮條控件參數包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
懸浮條控件一排工具按鈕可自定義，通過結構體參數設置，圖標可選圖形字體還是自定義圖片。
懸浮條按鈕內部實現了錄像切換、抓拍截圖、靜音切換、關閉視頻等功能，也可以自行在源碼中增加自己對應的功能。
懸浮條按鈕對應實現了功能的按鈕，有對應圖標切換處理，比如錄像按鈕按下後會切換到正在錄像中的圖標，聲音按鈕切換後變成靜音圖標，再次切換還原。
懸浮條按鈕單擊後都用名稱唯一標識作爲信號發出，可以自行關聯響應處理。
懸浮條空白區域可以顯示提示信息，默認顯示當前視頻分辨率大小，可以增加幀率、碼流大小等信息。
視頻控件參數包括邊框大小、邊框顏色、焦點顏色、背景顏色（默認透明）、文字顏色（默認全局文字顏色）、填充顏色（視頻外的空白處填充黑色）、背景文字、背景圖片（如果設置了圖片優先取圖片）、是否拷貝圖片、縮放顯示模式（自動調整、等比例縮放、拉伸填充）、視頻顯示模式（句柄、繪製、GPU）、啓用懸浮條、懸浮條尺寸（橫向爲高度、縱向爲寬度）、懸浮條位置（頂部、底部、左側、右側）。

4.4 內核ffmpeg

支持各種音視頻文件、本地攝像頭設備，各種視頻流網絡流。
支持開始播放、暫停播放、繼續播放、停止播放、設置播放進度、倍速播放。
可設置音量、靜音切換、抓拍圖片、錄像存儲。
自動提取專輯信息比如標題、藝術家、專輯、專輯封面，自動顯示專輯封面。
完美支持音視頻同步和倍速播放。
解碼策略支持速度優先、質量優先、均衡處理、最快速度。
支持手機視頻旋轉角度顯示，比如一般手機拍攝的視頻是旋轉了90度的，解碼顯示的時候需要重新旋轉90度纔是正的。
自動轉換yuv420格式，比如本地攝像頭是yuyv422格式，有些視頻文件是xx格式，統一將非yuv420格式轉換，然後再進行處理。
支持硬解碼dxva2、d3d11va等，性能極高尤其是大分辨率比如4K視頻。
視頻響應極低延遲0.2s左右，極速響應打開視頻流0.5s左右，專門做了優化處理。
硬解碼和GPU繪製組合，極低CPU佔用，比海康大華等客戶端更優。
支持視頻流中的各種音頻格式，AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持，推薦選擇AAC兼容性跨平臺性最好。
視頻存儲支持yuv、h264、mp4多種格式，音頻存儲支持pcm、wav、aac多種格式。默認視頻mp4格式、音頻aac格式。
支持分開存儲音頻視頻文件，也支持合併到一個mp4文件，默認策略是無論何種音視頻文件格式存儲，最終都轉成mp4及aac格式，然後合併成音視頻一起的mp4文件。
支持本地攝像頭實時視頻顯示帶音頻輸入輸出，音視頻錄製合併到一個mp4文件。
支持H265編碼（現在越來越多的監控攝像頭是H265視頻流格式）生成視頻文件，內部自動識別切換編碼格式。
自動識別視頻流動態分辨率改動，重新打開視頻流。
純qt+ffmpeg解碼，非sdl等第三方繪製播放依賴，gpu繪製採用qopenglwidget，音頻播放採用qaudiooutput。
同時支持ffmpeg2、ffmpeg3、ffmpeg4、ffmpeg5版本，全部做了兼容處理。如果需要支持xp需要選用ffmpeg3及以下。

五、相關代碼

int FFmpegFilter::initFilter(AbstractVideoThread *thread, AVStream *stream, AVCodecContext *avctx, FilterData &filterData)
{
    int result = -1;
    QString step;
    if (!filterData.enable) {
        filterData.isOk = false;
        return result;
    }

    //先釋放相關資源
    freeFilter(filterData);

    //獲取濾鏡字符串
    QString filters = getFilter(filterData);
    if (filters.isEmpty()) {
        return result;
    }

    //輸入幀序列的參數信息
    QStringList listArg;
    listArg << QString("video_size=%1x%2").arg(avctx->width).arg(avctx->height);
    listArg << QString("pix_fmt=%1").arg(filterData.formatIn == AV_PIX_FMT_NV12 ? AV_PIX_FMT_NV12 : avctx->pix_fmt);
    listArg << QString("time_base=%1/%2").arg(stream->time_base.num).arg(stream->time_base.den);
    listArg << QString("pixel_aspect=%1/%2").arg(avctx->sample_aspect_ratio.num).arg(avctx->sample_aspect_ratio.den);
    QString args = listArg.join(":");

    //輸入幀格式
    enum AVPixelFormat pix_fmts[] = {filterData.formatIn, AV_PIX_FMT_NONE};

    //獲取要使用的濾鏡
    const AVFilter *filterSrc = avfilter_get_by_name("buffer");
    const AVFilter *filterSink = avfilter_get_by_name("buffersink");

    //創建輸入輸出濾鏡參數
    AVFilterInOut *inputs = avfilter_inout_alloc();
    AVFilterInOut *outputs = avfilter_inout_alloc();

    //創建濾鏡容器
    filterData.filterGraph = avfilter_graph_alloc();
    if (!inputs || !outputs || !filterData.filterGraph) {
        result = AVERROR(ENOMEM);
        goto end;
    }

    //創建輸入濾鏡
    result = avfilter_graph_create_filter(&filterData.filterSrcCtx, filterSrc, "in", args.toUtf8().constData(), NULL, filterData.filterGraph);
    if (result < 0) {
        step = "創建輸入濾鏡";
        goto end;
    }

    //創建輸出濾鏡
    result = avfilter_graph_create_filter(&filterData.filterSinkCtx, filterSink, "out", NULL, NULL, filterData.filterGraph);
    if (result < 0) {
        step = "創建輸出濾鏡";
        goto end;
    }

    //設置輸出濾鏡格式
    result = av_opt_set_int_list(filterData.filterSinkCtx, "pix_fmts", pix_fmts, filterData.formatOut, AV_OPT_SEARCH_CHILDREN);
    if (result < 0) {
        step = "設置輸出格式";
        goto end;
    }

    //設置濾鏡的參數
    outputs->name = av_strdup("in");
    outputs->filter_ctx = filterData.filterSrcCtx;
    outputs->pad_idx = 0;
    outputs->next = NULL;

    inputs->name = av_strdup("out");
    inputs->filter_ctx = filterData.filterSinkCtx;
    inputs->pad_idx = 0;
    inputs->next = NULL;

    //初始化濾鏡
    result = avfilter_graph_parse_ptr(filterData.filterGraph, filters.toUtf8().constData(), &inputs, &outputs, NULL);
    if (result < 0) {
        step = "應用濾鏡參數";
        goto end;
    }

    //應用濾鏡配置
    result = avfilter_graph_config(filterData.filterGraph, NULL);
    if (result < 0) {
        step = "應用濾鏡配置";
        goto end;
    }

end:
    //釋放對應的輸入輸出
    avfilter_inout_free(&inputs);
    avfilter_inout_free(&outputs);
    filterData.isOk = (result >= 0);
    thread->debug("濾鏡處理", filterData.isOk ? "創建濾鏡完成" : QString("%1失敗: %2").arg(step).arg(FFmpegHelper::getError(result)), "");
    return result;
}

void FFmpegFilter::freeFilter(FilterData &filterData)
{
    if (filterData.isOk) {
        filterData.enable = true;
        filterData.init = true;
        filterData.isOk = false;

        avfilter_free(filterData.filterSrcCtx);
        avfilter_free(filterData.filterSinkCtx);
        avfilter_graph_free(&filterData.filterGraph);
        filterData.filterSrcCtx = NULL;
        filterData.filterSinkCtx = NULL;
        filterData.filterGraph = NULL;
    }
}

Qt音視頻開發47-文字和圖片水印（可存儲到MP4中）

一、前言

二、效果圖

三、體驗地址

四、功能特點

4.1 基礎功能

4.2 特色功能

4.3 視頻控件

4.4 內核ffmpeg

五、相關代碼

Qt/C++音視頻開發75-獲取本地有哪些攝像頭名稱/Qt內置函數方式

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

Qt/C++音視頻開發73-高效濾鏡/文字水印/圖形水印/圖片水印/yolo運算後的結果顯示到畫面中

Qt/C++音視頻開發72-倍速推流/音視頻同步倍速推流/不改變幀率和採樣率/低倍速和高倍速

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結