一、前言
通過在通道畫面上拾取鼠標按下的座標,然後鼠標移動,直到鬆開,根據鬆開的座標和按下的座標,繪製一個矩形區域,作爲熱點或者需要電子放大的區域,拿到這個座標區域,用途非常多,可以直接將區域中的畫面放大,也可以將該圈起來的區域位置發給設備,由設備設定對應的熱點區域作爲集中觀察點,可以用來人工智能分析,比如出現在該區域的人臉,可以判定爲入侵,該區域內的畫面被改動過,判定爲物體非法挪動等。各種各樣的分析算法應用上來,就可以做出非常多的檢測效果,這些都有個前提,那就是用戶能夠在視頻畫面中自由的選擇自己需要的區域,這就是要實現的功能。
採集到的視頻數據,在UI界面上,可能是拉伸填充顯示的,也可能是等比例縮放顯示的,最重要的是,顯示的窗體,幾乎不大可能剛好是和分辨率大小一樣,所以這就涉及到一個轉換關係,就是根據窗體的尺寸和視頻的尺寸,當前鼠標按下的座標,需要換算成視頻對應的座標,換算公式是:視頻X=座標X / 窗體寬度 * 視頻寬度,視頻Y=座標Y / 窗體高度 * 視頻高度。所以在視頻窗體控件上識別鼠標按下/鼠標移動/鼠標鬆開事件進行處理即可,最後發送信號出去,帶上類型(鼠標按下/鼠標移動/鼠標鬆開)和QPoint座標。爲什麼要帶上類型呢?方便用戶處理,比如識別到用戶按下就記住座標,移動的時候繪製方框,結束的時候發送濾鏡執行裁剪也就是電子放大操作。
二、效果圖
三、體驗地址
- 國內站點:https://gitee.com/feiyangqingyun
- 國際站點:https://github.com/feiyangqingyun
- 個人作品:https://blog.csdn.net/feiyangqingyun/article/details/97565652
- 體驗地址:https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼:01jf 文件名:bin_video_demo。
- 視頻主頁:https://space.bilibili.com/687803542
四、功能特點
4.1. 基礎功能
- 支持各種音頻視頻文件格式,比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
- 支持本地攝像頭設備和本地桌面採集,支持多設備和多屏幕。
- 支持各種視頻流格式,比如rtp、rtsp、rtmp、http、udp等。
- 本地音視頻文件和網絡音視頻文件,自動識別文件長度、播放進度、音量大小、靜音狀態等。
- 文件可以指定播放位置、調節音量大小、設置靜音狀態等。
- 支持倍速播放文件,可選0.5倍、1.0倍、2.5倍、5.0倍等速度,相當於慢放和快放。
- 支持開始播放、停止播放、暫停播放、繼續播放。
- 支持抓拍截圖,可指定文件路徑,可選抓拍完成是否自動顯示預覽。
- 支持錄像存儲,手動開始錄像、停止錄像,部分內核支持暫停錄像後繼續錄像,跳過不需要錄像的部分。
- 支持無感知切換循環播放、自動重連等機制。
- 提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態變化等信號。
- 多線程處理,一個解碼一個線程,不卡主界面。
4.2. 特色功能
- 同時支持多種解碼內核,包括qmedia內核(Qt4/Qt5/Qt6)、ffmpeg內核(ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5/ffmpeg6)、vlc內核(vlc2/vlc3)、mpv內核(mpv1/mp2)、mdk內核、海康sdk、easyplayer內核等。
- 非常完善的多重基類設計,新增一種解碼內核只需要實現極少的代碼量,就可以應用整套機制,極易拓展。
- 同時支持多種畫面顯示策略,自動調整(原始分辨率小於顯示控件尺寸則按照原始分辨率大小顯示,否則等比縮放)、等比縮放(永遠等比縮放)、拉伸填充(永遠拉伸填充)。所有內核和所有視頻顯示模式下都支持三種畫面顯示策略。
- 同時支持多種視頻顯示模式,句柄模式(傳入控件句柄交給對方繪製控制)、繪製模式(回調拿到數據後轉成QImage用QPainter繪製)、GPU模式(回調拿到數據後轉成yuv用QOpenglWidget繪製)。
- 支持多種硬件加速類型,ffmpeg可選dxva2、d3d11va等,vlc可選any、dxva2、d3d11va,mpv可選auto、dxva2、d3d11va,mdk可選dxva2、d3d11va、cuda、mft等。不同的系統環境有不同的類型選擇,比如linux系統有vaapi、vdpau,macos系統有videotoolbox。
- 解碼線程和顯示窗體分離,可指定任意解碼內核掛載到任意顯示窗體,動態切換。
- 支持共享解碼線程,默認開啓並且自動處理,當識別到相同的視頻地址,共享一個解碼線程,在網絡視頻環境中可以大大節約網絡流量以及對方設備的推流壓力。國內頂尖視頻廠商均採用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
- 自動識別視頻旋轉角度並繪製,比如手機上拍攝的視頻一般是旋轉了90度的,播放的時候要自動旋轉處理,不然默認是倒着的。
- 自動識別視頻流播放過程中分辨率的變化,在視頻控件上自動調整尺寸。比如攝像機可以在使用過程中動態配置分辨率,當分辨率改動後對應視頻控件也要做出同步反應。
- 音視頻文件無感知自動切換循環播放,不會出現切換期間黑屏等肉眼可見的切換痕跡。
- 視頻控件同時支持任意解碼內核、任意畫面顯示策略、任意視頻顯示模式。
- 視頻控件懸浮條同時支持句柄、繪製、GPU三種模式,非絕對座標移來移去。
- 本地攝像頭設備支持指定設備名稱、分辨率、幀率進行播放。
- 本地桌面採集支持設定採集區域、偏移值、指定桌面索引、幀率、多個桌面同時採集等。還支持指定窗口標題採集固定窗口。
- 錄像文件同時支持打開的視頻文件、本地攝像頭、本地桌面、網絡視頻流等。
- 瞬間響應打開和關閉,無論是打開不存在的視頻或者網絡流,探測設備是否存在,讀取中的超時等待,收到關閉指令立即中斷之前的操作並響應。
- 支持打開各種圖片文件,支持本地音視頻文件拖曳播放。
- 視頻流通信方式可選tcp/udp,有些設備可能只提供了某一種協議通信比如tcp,需要指定該種協議方式打開。
- 可設置連接超時時間(視頻流探測用的超時時間)、讀取超時時間(採集過程中的超時時間)。
- 支持逐幀播放,提供上一幀/下一幀函數接口,可以逐幀查閱採集到的圖像。
- 音頻文件自動提取專輯信息比如標題、藝術家、專輯、專輯封面,自動顯示專輯封面。
- 視頻響應極低延遲0.2s左右,極速響應打開視頻流0.5s左右,專門做了優化處理。
- 支持H264/H265編碼(現在越來越多的監控攝像頭是H265視頻流格式)生成視頻文件,內部自動識別切換編碼格式。
- 支持用戶信息中包含特殊字符(比如用戶信息中包含+#@等字符)的視頻流播放,內置解析轉義處理。
- 支持濾鏡,各種水印及圖形效果,支持多個水印和圖像,可以將OSD標籤信息和各種圖形信息寫入到MP4文件。
- 支持視頻流中的各種音頻格式,AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持,推薦選擇AAC兼容性跨平臺性最好。
- 內核ffmpeg採用純qt+ffmpeg解碼,非sdl等第三方繪製播放依賴,gpu繪製採用qopenglwidget,音頻播放採用qaudiooutput。
- 內核ffmpeg和內核mdk支持安卓,其中mdk支持安卓硬解碼,性能非常兇殘。
- 可以切換音視頻軌道,也就是節目通道,可能ts文件帶了多個音視頻節目流,可以分別設置要播放哪一個,可以播放前設置好和播放過程中動態設置。
- 可以設置視頻旋轉角度,可以播放前設置好和播放過程中動態改變。
- 視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視頻等功能。
- 音頻組件支持聲音波形值數據解析,可以根據該值繪製波形曲線和柱狀聲音條,默認提供了聲音振幅信號。
- 標籤和圖形信息支持三種繪製方式,繪製到遮罩層、繪製到圖片、源頭繪製(對應信息可以存儲到文件)。
- 通過傳入一個url地址,該地址可以帶上通信協議、分辨率、幀率等信息,無需其他設置。
- 保存視頻到文件支持三種策略,自動處理、僅限文件、全部轉碼,轉碼策略支持自動識別、轉264、轉265,編碼保存支持指定分辨率縮放或者等比例縮放。比如對保存文件體積有要求可以指定縮放後再存儲。
- 支持加密保存文件和解密播放文件,可以指定祕鑰文本。
- 提供的監控佈局類支持64通道同時顯示,還支持各種異型佈局,比如13通道,手機上6行2列布局。各種佈局可以自由定義。
- 支持電子放大,在懸浮條切換到電子放大模式,在畫面上選擇需要放大的區域,選取完畢後自動放大,再次切換放大模式可以復位。
- 各組件中極其詳細的打印信息提示,尤其是報錯信息提示,封裝的統一打印格式。針對現場複雜的設備環境測試極其方便有用,相當於精確定位到具體哪個通道哪個步驟出錯。
- 同時提供了簡單示例、視頻播放器、多畫面視頻監控、監控回放、逐幀播放、多屏渲染等單獨窗體示例,專門演示對應功能如何使用。
- 監控回放可選不同廠家類型、回放時間段、用戶信息、指定通道。支持切換回放進度。
- 可以從聲卡設備下拉框選擇聲卡播放聲音,提供對應的切換聲卡函數接口。
- 支持編譯到手機app使用,提供了專門的手機app佈局界面,可以作爲手機上的視頻監控使用。
- 代碼框架和結構優化到最優,性能強悍,註釋詳細,持續迭代更新升級。
- 源碼支持windows、linux、mac、android等,支持各種國產linux系統,包括但不限於統信UOS/中標麒麟/銀河麒麟等。還支持嵌入式linux。
- 源碼支持Qt4、Qt5、Qt6,兼容所有版本。
4.3. 視頻控件
- 可動態添加任意多個osd標籤信息,標籤信息包括名字、是否可見、字號大小、文本文字、文本顏色、背景顏色、標籤圖片、標籤座標、標籤格式(文本、日期、時間、日期時間、圖片)、標籤位置(左上角、左下角、右上角、右下角、居中、自定義座標)。
- 可動態添加任意多個圖形信息,這個非常有用,比如人工智能算法解析後的圖形區域信息直接發給視頻控件即可。圖形信息支持任意形狀,直接繪製在原始圖片上,採用絕對座標。
- 圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區域、路徑集合、點座標集合等。
- 每個圖形信息都可指定三種區域中的一種或者多種,指定了的都會繪製。
- 內置懸浮條控件,懸浮條位置支持頂部、底部、左側、右側。
- 懸浮條控件參數包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
- 懸浮條控件一排工具按鈕可自定義,通過結構體參數設置,圖標可選圖形字體還是自定義圖片。
- 懸浮條按鈕內部實現了錄像切換、抓拍截圖、靜音切換、關閉視頻等功能,也可以自行在源碼中增加自己對應的功能。
- 懸浮條按鈕對應實現了功能的按鈕,有對應圖標切換處理,比如錄像按鈕按下後會切換到正在錄像中的圖標,聲音按鈕切換後變成靜音圖標,再次切換還原。
- 懸浮條按鈕單擊後都用名稱唯一標識作爲信號發出,可以自行關聯響應處理。
- 懸浮條空白區域可以顯示提示信息,默認顯示當前視頻分辨率大小,可以增加幀率、碼流大小等信息。
- 視頻控件參數包括邊框大小、邊框顏色、焦點顏色、背景顏色(默認透明)、文字顏色(默認全局文字顏色)、填充顏色(視頻外的空白處填充黑色)、背景文字、背景圖片(如果設置了圖片優先取圖片)、是否拷貝圖片、縮放顯示模式(自動調整、等比縮放、拉伸填充)、視頻顯示模式(句柄、繪製、GPU)、啓用懸浮條、懸浮條尺寸(橫向爲高度、縱向爲寬度)、懸浮條位置(頂部、底部、左側、右側)。
五、相關代碼
void VideoWidget::btnClicked(const QString &btnName)
{
QString flag = widgetPara.videoFlag;
QString name = STRDATETIMEMS;
if (!flag.isEmpty()) {
name = QString("%1_%2").arg(flag).arg(name);
}
if (btnName.endsWith("btnRecord")) {
QString fileName = QString("%1/%2.mp4").arg(recordPath).arg(name);
this->recordStart(fileName);
} else if (btnName.endsWith("btnStop")) {
this->recordStop();
} else if (btnName.endsWith("btnSound")) {
this->setMuted(true);
} else if (btnName.endsWith("btnMuted")) {
this->setMuted(false);
} else if (btnName.endsWith("btnSnap")) {
QString snapName = QString("%1/%2.jpg").arg(snapPath).arg(name);
this->snap(snapName, false);
} else if (btnName.endsWith("btnCrop")) {
if (videoThread) {
if (videoPara.videoCore == VideoCore_FFmpeg) {
QMetaObject::invokeMethod(videoThread, "setCrop", Q_ARG(bool, true));
}
}
} else if (btnName.endsWith("btnReset")) {
if (videoThread) {
this->removeGraph("crop");
if (videoPara.videoCore == VideoCore_FFmpeg) {
QMetaObject::invokeMethod(videoThread, "setCrop", Q_ARG(bool, false));
}
}
} else if (btnName.endsWith("btnAlarm")) {
} else if (btnName.endsWith("btnClose")) {
this->stop();
}
}
void AbstractVideoWidget::appendGraph(const GraphInfo &graph)
{
QMutexLocker locker(&mutex);
listGraph << graph;
this->update();
emit sig_graphChanged();
}
void AbstractVideoWidget::removeGraph(const QString &name)
{
QMutexLocker locker(&mutex);
int count = listGraph.count();
for (int i = 0; i < count; ++i) {
if (listGraph.at(i).name == name) {
listGraph.removeAt(i);
break;
}
}
this->update();
emit sig_graphChanged();
}
void AbstractVideoWidget::clearGraph()
{
QMutexLocker locker(&mutex);
listGraph.clear();
this->update();
emit sig_graphChanged();
}
QString FilterHelper::getFilter(const GraphInfo &graph, bool hardware)
{
//drawbox=x=10:y=10:w=100:h=100:c=#ffffff@1:t=2
QString filter;
//有個現象就是硬解碼下的圖形濾鏡會導致原圖顏色不對
if (hardware) {
return filter;
}
//暫時只實現了矩形區域
QRect rect = graph.rect;
if (rect.isEmpty()) {
return filter;
}
//過濾關鍵字用於電子放大
if (graph.name == "crop") {
filter = QString("crop=%1:%2:%3:%4").arg(rect.width()).arg(rect.height()).arg(rect.x()).arg(rect.y());
return filter;
}
QStringList list;
list << QString("x=%1").arg(rect.x());
list << QString("y=%1").arg(rect.y());
list << QString("w=%1").arg(rect.width());
list << QString("h=%1").arg(rect.height());
QColor color = graph.borderColor;
list << QString("c=%1@%2").arg(color.name()).arg(color.alphaF());
//背景顏色不透明則填充背景顏色
if (graph.bgColor == Qt::transparent) {
list << QString("t=%1").arg(graph.borderWidth);
} else {
list << QString("t=%1").arg("fill");
}
filter = QString("drawbox=%1").arg(list.join(":"));
return filter;
}
QString FilterHelper::getFilters(const QStringList &listFilter)
{
//挨個取出圖片濾鏡對應的圖片和座標
int count = listFilter.count();
QStringList listImage, listPosition, listTemp;
for (int i = 0; i < count; ++i) {
QString filter = listFilter.at(i);
if (filter.startsWith("movie=")) {
QStringList list = filter.split(";");
QString movie = list.first();
QString overlay = list.last();
movie.replace("[wm]", "");
overlay.replace("[wm]", "");
overlay.replace("[in]", "");
overlay.replace("[out]", "");
listImage << movie;
listPosition << overlay;
} else {
listTemp << filter;
}
}
//圖片濾鏡字符串在下面重新處理
QString filterImage, filterAll;
QString filterOther = listTemp.join(",");
//存在圖片水印需要重新調整濾鏡字符串
//1張圖: movie=./osd.png[wm0];[in][wm0]overlay=0:0[out]
//2張圖: movie=./osd.png[wm0];movie=./osd.png[wm1];[in][wm0]overlay=0:0[a];[a][wm1]overlay=0:0[out]
//3張圖: movie=./osd.png[wm0];movie=./osd.png[wm1];movie=./osd.png[wm2];[in][wm0]overlay=0:0[a0];[a0][wm1]overlay=0:0[a1];[a1][wm2]overlay=0:0[out]
count = listImage.count();
if (count > 0) {
//加上標識符和頭部和尾部標識符
for (int i = 0; i < count; ++i) {
QString flag = QString("[wm%1]").arg(i);
listImage[i] = listImage.at(i) + flag;
listPosition[i] = flag + listPosition.at(i);
listPosition[i] = (i == 0 ? "[in]" : QString("[a%1]").arg(i - 1)) + listPosition.at(i);
listPosition[i] = listPosition.at(i) + (i == (count - 1) ? "[out]" : QString("[a%1]").arg(i));
}
QStringList filters;
for (int i = 0; i < count; ++i) {
filters << listImage.at(i);
}
for (int i = 0; i < count; ++i) {
filters << listPosition.at(i);
}
//圖片濾鏡集合最終字符串
filterImage = filters.join(";");
//存在其他濾鏡則其他濾鏡在前面
if (listTemp.count() > 0) {
filterImage.replace("[in]", "[other]");
filterAll = "[in]" + filterOther + "[other];" + filterImage;
} else {
filterAll = filterImage;
}
} else {
filterAll = filterOther;
}
return filterAll;
}
QStringList FilterHelper::getFilters(const QList<OsdInfo> &listOsd, const QList<GraphInfo> &listGraph, bool noimage, bool hardware)
{
//濾鏡內容字符串集合
QStringList listFilter;
//加入標籤信息
foreach (OsdInfo osd, listOsd) {
QString filter = FilterHelper::getFilter(osd, noimage);
if (!filter.isEmpty()) {
listFilter << filter;
}
}
//加入圖形信息
foreach (GraphInfo graph, listGraph) {
QString filter = FilterHelper::getFilter(graph, hardware);
if (!filter.isEmpty()) {
listFilter << filter;
}
}
//加入其他濾鏡
QString filter = FilterHelper::getFilter();
if (!filter.isEmpty()) {
listFilter << filter;
}
return listFilter;
}