一、前言
最近一個月一直在研究mdk-sdk音視頻組件,這個組件是原qtav作者的最新力作,提供了各種各樣的示例demo,不僅限於支持C++,其他各種比如java/flutter/web/android等全部支持,性能上也是槓槓的,目前大概是在V0.23版本,大部分軟件發佈基本上都是在1.0版本纔是比較穩定的,不過目前用下來,感覺還是挺不錯的,跨平臺,什麼windows/linux/macos/ios/android/web等全部支持,底層還支持各種渲染框架。其實mdk底層就是封裝的ffmpeg,也可以說核心就是ffmpeg,得益於作者在ffmpeg的使用方面應該是到了如火純情的境界,主要是三大塊,一塊是音視頻同步、一塊是硬解碼、一塊是渲染到不同的平臺。這三大快在音視頻領域都是重點也是難點,要想做的穩定做得好性能又好,是很難的。沒個十年八年的功力是不行的。
由於mdk-sdk作者也是搞qt開發很多年,所以對qt+mdk的使用提供了非常友好完善的示例。
第一步:下載示例源碼 git clone [email protected]:wang-bin/mdk-examples.git
第二步:下載庫文件 https://sourceforge.net/projects/mdk-sdk/files/nightly/
第三步:將mdk-sdk目錄放到mdk-examples目錄下。
第四步:打開projects.pro編譯就行,如果本機沒有vulkan環境,可以註釋vkwindow、qmlrhi 、qmlrhi0項目。
在經歷衆多音視頻組件的各種高強度對比測試驗證下,mdk的優點非常多,這裏就不多說,缺點就是線程有點多,一個播放基本上就佔了30個線程,10個就是300,可能是通過犧牲一部分內存來提升性能,好比谷歌瀏覽器也是佔內存大戶,但是性能強悍,目前幾乎是一統瀏覽器江湖。各種播放組件中,對於4K、8K、16K視頻文件的解碼,開啓硬解碼模式下,mpv是全宇宙CPU佔用最低的,其次就是mdk,vlc的表現最拉垮。可能mpv直接走的屏幕繪製,直接是顯卡中的數據繪製的,沒有經過內存拷貝。
二、效果圖
三、體驗地址
- 國內站點:https://gitee.com/feiyangqingyun
- 國際站點:https://github.com/feiyangqingyun
- 個人作品:https://blog.csdn.net/feiyangqingyun/article/details/97565652
- 體驗地址:https://pan.baidu.com/s/1d7TH_GEYl5nOecuNlWJJ7g 提取碼:01jf 文件名:bin_video_demo。
四、功能特點
4.1. 基礎功能
- 支持各種音頻視頻文件格式,比如mp3、wav、mp4、asf、rm、rmvb、mkv等。
- 支持本地攝像頭設備和本地桌面採集,支持多設備和多屏幕。
- 支持各種視頻流格式,比如rtp、rtsp、rtmp、http、udp等。
- 本地音視頻文件和網絡音視頻文件,自動識別文件長度、播放進度、音量大小、靜音狀態等。
- 文件可以指定播放位置、調節音量大小、設置靜音狀態等。
- 支持倍速播放文件,可選0.5倍、1.0倍、2.5倍、5.0倍等速度,相當於慢放和快放。
- 支持開始播放、停止播放、暫停播放、繼續播放。
- 支持抓拍截圖,可指定文件路徑,可選抓拍完成是否自動顯示預覽。
- 支持錄像存儲,手動開始錄像、停止錄像,部分內核支持暫停錄像後繼續錄像,跳過不需要錄像的部分。
- 支持無感知切換循環播放、自動重連等機制。
- 提供播放成功、播放完成、收到解碼圖片、收到抓拍圖片、視頻尺寸變化、錄像狀態變化等信號。
- 多線程處理,一個解碼一個線程,不卡主界面。
4.2. 特色功能
- 同時支持多種解碼內核,包括qmedia內核(Qt4/Qt5/Qt6)、ffmpeg內核(ffmpeg2/ffmpeg3/ffmpeg4/ffmpeg5/ffmpeg6)、vlc內核(vlc2/vlc3)、mpv內核(mpv1/mp2)、mdk內核、海康sdk、easyplayer內核等。
- 非常完善的多重基類設計,新增一種解碼內核只需要實現極少的代碼量,就可以應用整套機制,極易拓展。
- 同時支持多種畫面顯示策略,自動調整(原始分辨率小於顯示控件尺寸則按照原始分辨率大小顯示,否則等比縮放)、等比縮放(永遠等比縮放)、拉伸填充(永遠拉伸填充)。所有內核和所有視頻顯示模式下都支持三種畫面顯示策略。
- 同時支持多種視頻顯示模式,句柄模式(傳入控件句柄交給對方繪製控制)、繪製模式(回調拿到數據後轉成QImage用QPainter繪製)、GPU模式(回調拿到數據後轉成yuv用QOpenglWidget繪製)。
- 支持多種硬件加速類型,ffmpeg可選dxva2、d3d11va等,vlc可選any、dxva2、d3d11va,mpv可選auto、dxva2、d3d11va,mdk可選dxva2、d3d11va、cuda、mft等。不同的系統環境有不同的類型選擇,比如linux系統有vaapi、vdpau,macos系統有videotoolbox。
- 解碼線程和顯示窗體分離,可指定任意解碼內核掛載到任意顯示窗體,動態切換。
- 支持共享解碼線程,默認開啓並且自動處理,當識別到相同的視頻地址,共享一個解碼線程,在網絡視頻環境中可以大大節約網絡流量以及對方設備的推流壓力。國內頂尖視頻廠商均採用此策略。這樣只要拉一路視頻流就可以共享到幾十個幾百個通道展示。
- 自動識別視頻旋轉角度並繪製,比如手機上拍攝的視頻一般是旋轉了90度的,播放的時候要自動旋轉處理,不然默認是倒着的。
- 自動識別視頻流播放過程中分辨率的變化,在視頻控件上自動調整尺寸。比如攝像機可以在使用過程中動態配置分辨率,當分辨率改動後對應視頻控件也要做出同步反應。
- 音視頻文件無感知自動切換循環播放,不會出現切換期間黑屏等肉眼可見的切換痕跡。
- 視頻控件同時支持任意解碼內核、任意畫面顯示策略、任意視頻顯示模式。
- 視頻控件懸浮條同時支持句柄、繪製、GPU三種模式,非絕對座標移來移去。
- 本地攝像頭設備支持指定設備名稱、分辨率、幀率進行播放。
- 本地桌面採集支持設定採集區域、偏移值、指定桌面索引、幀率、多個桌面同時採集等。
- 錄像文件同時支持打開的視頻文件、本地攝像頭、本地桌面、網絡視頻流等。
- 瞬間響應打開和關閉,無論是打開不存在的視頻或者網絡流,探測設備是否存在,讀取中的超時等待,收到關閉指令立即中斷之前的操作並響應。
- 支持打開各種圖片文件,支持本地音視頻文件拖曳播放。
- 視頻流通信方式可選tcp/udp,有些設備可能只提供了某一種協議通信比如tcp,需要指定該種協議方式打開。
- 可設置連接超時時間(視頻流探測用的超時時間)、讀取超時時間(採集過程中的超時時間)。
- 支持逐幀播放,提供上一幀/下一幀函數接口,可以逐幀查閱採集到的圖像。
- 音頻文件自動提取專輯信息比如標題、藝術家、專輯、專輯封面,自動顯示專輯封面。
- 視頻響應極低延遲0.2s左右,極速響應打開視頻流0.5s左右,專門做了優化處理。
- 支持H264/H265編碼(現在越來越多的監控攝像頭是H265視頻流格式)生成視頻文件,內部自動識別切換編碼格式。
- 支持用戶信息中包含特殊字符(比如用戶信息中包含+#@等字符)的視頻流播放,內置解析轉義處理。
- 支持濾鏡,各種水印及圖形效果,支持多個水印和圖像,可以將OSD標籤信息和各種圖形信息寫入到MP4文件。
- 支持視頻流中的各種音頻格式,AAC、PCM、G.726、G.711A、G.711Mu、G.711ulaw、G.711alaw、MP2L2等都支持,推薦選擇AAC兼容性跨平臺性最好。
- 內核ffmpeg採用純qt+ffmpeg解碼,非sdl等第三方繪製播放依賴,gpu繪製採用qopenglwidget,音頻播放採用qaudiooutput。
- 內核ffmpeg和內核mdk支持安卓,其中mdk支持安卓硬解碼,性能非常兇殘。
- 可以切換音視頻軌道,也就是節目通道,可能ts文件帶了多個音視頻節目流,可以分別設置要播放哪一個,可以播放前設置好和播放過程中動態設置。
- 可以設置視頻旋轉角度,可以播放前設置好和播放過程中動態設置。
- 視頻控件懸浮條自帶開始和停止錄像切換、聲音靜音切換、抓拍截圖、關閉視頻等功能。
- 音頻組件支持聲音波形值數據解析,可以根據該值繪製波形曲線和柱狀聲音條,默認提供了聲音振幅信號。
- 標籤和圖形信息支持三種繪製方式,繪製到遮罩層、繪製到圖片、源頭繪製(對應信息可以存儲到文件)。
- 通過傳入一個url地址,該地址可以帶上通信協議、分辨率、幀率等信息,無需其他設置。
- 保存視頻到文件支持三種策略,自動處理、僅限文件、全部轉碼,轉碼策略支持自動識別、轉264、轉265,編碼保存支持指定分辨率縮放或者等比例縮放。比如對保存文件體積有要求可以指定縮放後再存儲。
- 支持加密保存文件和解密播放文件,可以指定祕鑰文本。
- 支持電子放大,在懸浮條切換到電子放大模式,在畫面上選擇需要放大的區域,選取完畢後自動放大,再次切換放大模式可以復位。
- 各組件中極其詳細的打印信息提示,尤其是報錯信息提示,封裝的統一打印格式。針對現場複雜的設備環境測試極其方便有用,相當於精確定位到具體哪個通道哪個步驟出錯。
- 同時提供了簡單示例、視頻播放器、多畫面視頻監控、監控回放、逐幀播放、多屏渲染等單獨窗體示例,專門演示對應功能如何使用。
- 代碼框架和結構優化到最優,性能強悍,持續迭代更新升級。
- 源碼支持Qt4、Qt5、Qt6,兼容所有版本。
4.3. 視頻控件
- 可動態添加任意多個osd標籤信息,標籤信息包括名字、是否可見、字號大小、文本文字、文本顏色、背景顏色、標籤圖片、標籤座標、標籤格式(文本、日期、時間、日期時間、圖片)、標籤位置(左上角、左下角、右上角、右下角、居中、自定義座標)。
- 可動態添加任意多個圖形信息,這個非常有用,比如人工智能算法解析後的圖形區域信息直接發給視頻控件即可。圖形信息支持任意形狀,直接繪製在原始圖片上,採用絕對座標。
- 圖形信息包括名字、邊框大小、邊框顏色、背景顏色、矩形區域、路徑集合、點座標集合等。
- 每個圖形信息都可指定三種區域中的一種或者多種,指定了的都會繪製。
- 內置懸浮條控件,懸浮條位置支持頂部、底部、左側、右側。
- 懸浮條控件參數包括邊距、間距、背景透明度、背景顏色、文本顏色、按下顏色、位置、按鈕圖標代碼集合、按鈕名稱標識集合、按鈕提示信息集合。
- 懸浮條控件一排工具按鈕可自定義,通過結構體參數設置,圖標可選圖形字體還是自定義圖片。
- 懸浮條按鈕內部實現了錄像切換、抓拍截圖、靜音切換、關閉視頻等功能,也可以自行在源碼中增加自己對應的功能。
- 懸浮條按鈕對應實現了功能的按鈕,有對應圖標切換處理,比如錄像按鈕按下後會切換到正在錄像中的圖標,聲音按鈕切換後變成靜音圖標,再次切換還原。
- 懸浮條按鈕單擊後都用名稱唯一標識作爲信號發出,可以自行關聯響應處理。
- 懸浮條空白區域可以顯示提示信息,默認顯示當前視頻分辨率大小,可以增加幀率、碼流大小等信息。
- 視頻控件參數包括邊框大小、邊框顏色、焦點顏色、背景顏色(默認透明)、文字顏色(默認全局文字顏色)、填充顏色(視頻外的空白處填充黑色)、背景文字、背景圖片(如果設置了圖片優先取圖片)、是否拷貝圖片、縮放顯示模式(自動調整、等比縮放、拉伸填充)、視頻顯示模式(句柄、繪製、GPU)、啓用懸浮條、懸浮條尺寸(橫向爲高度、縱向爲寬度)、懸浮條位置(頂部、底部、左側、右側)。
五、相關代碼
#include "mdkplayer.h"
#include "videohelper.h"
MdkPlayer::MdkPlayer(QObject *parent) : QObject(parent)
{
//實例化播放對象
player = new mdk::Player;
//默認等比例填充
player->setAspectRatio(mdk::KeepAspectRatio);
//設置緩衝大小
//player->setBufferRange(0, 5000, true);
//渲染回調觸發界面更新
player->setRenderCallback([this](void *vo) {
QObject *render = (QObject *)vo;
if (render && render->isWidgetType()) {
QMetaObject::invokeMethod(render, "update");
}
});
//播放狀態變化
player->onStateChanged([this](mdk::State state) {
emit stateChanged(state);
});
//媒體狀態變化
player->onMediaStatus([this](mdk::MediaStatus oldValue, mdk::MediaStatus newValue) {
emit mediaStatusChanged(newValue);
return true;
});
//各種事件觸發
player->onEvent([this](const mdk::MediaEvent & e) {
emit eventChanged(e);
return false;
});
render = NULL;
}
MdkPlayer::~MdkPlayer()
{
//沒有設置過渲染窗體釋放的時候會崩潰
if (render) {
delete player;
}
}
void MdkPlayer::setMedia(const QString &url)
{
player->setMedia(url.toUtf8().constData());
//設置媒體後立即獲取媒體信息/手冊說要按照下面這樣寫
VideoType type = VideoHelper::getVideoType(url);
if (type == VideoType_FileLocal || type == VideoType_FileWeb) {
player->waitFor(mdk::State::Stopped);
player->prepare(0, [this](int64_t, bool *) {
QMetaObject::invokeMethod(parent(), "readMediaInfo");
return true;
});
}
//不做音視頻同步
if (type == VideoType_Rtsp) {
player->onSync([] {
return DBL_MAX;
});
}
}
void MdkPlayer::setFilter(const QString &filter)
{
player->setProperty("video.avfilter", filter.toStdString());
}
void MdkPlayer::setDecoders(const QStringList &names)
{
std::vector<std::string> decoders;
foreach (QString name, names) {
decoders.push_back(name.toStdString());
}
player->setDecoders(mdk::MediaType::Video, decoders);
}
void MdkPlayer::setProperty(const std::string &key, const std::string &value)
{
player->setProperty(key, value);
}
void MdkPlayer::play()
{
player->set(mdk::State::Playing);
}
void MdkPlayer::stop()
{
player->set(mdk::State::Stopped);
}
void MdkPlayer::pause()
{
player->set(mdk::State::Paused);
}
void MdkPlayer::next()
{
player->set(mdk::State::Playing);
}
mdk::State MdkPlayer::state()
{
return player->state();
}
void MdkPlayer::setLoop(int count)
{
player->setLoop(count);
}
void MdkPlayer::rotate(int degree, QObject *render)
{
player->rotate(degree, render);
}
void MdkPlayer::setAspect(float value, QObject *render)
{
player->setAspectRatio(value, render);
}
void MdkPlayer::setBackgroundColor(float r, float g, float b, float a, QObject *render)
{
player->setBackgroundColor(r, g, b, a, render);
}
QSize MdkPlayer::getSize(int stream)
{
QSize size;
std::vector<mdk::VideoStreamInfo> video = player->mediaInfo().video;
if (video.size() > stream) {
mdk::VideoCodecParameters para = video.at(stream).codec;
size = QSize(para.width, para.height);
}
return size;
}
qint64 MdkPlayer::duration()
{
return player->mediaInfo().duration;
}
qint64 MdkPlayer::position()
{
return player->position();
}
void MdkPlayer::seek(qint64 position)
{
player->seek(position);
}
void MdkPlayer::seek(bool backward, int frame)
{
mdk::SeekFlag flags = (mdk::SeekFlag::FromNow | mdk::SeekFlag::Frame);
if (backward) {
player->seek(-frame, flags);
} else {
player->seek(frame, flags);
}
}
float MdkPlayer::playbackRate()
{
return player->playbackRate();
}
void MdkPlayer::setPlaybackRate(float value)
{
player->setPlaybackRate(value);
}
float MdkPlayer::volume()
{
return player->volume();
}
void MdkPlayer::setVolume(float value)
{
player->setVolume(value);
}
bool MdkPlayer::isMute()
{
return player->isMute();
}
void MdkPlayer::setMute(bool value)
{
player->setMute(value);
}
void MdkPlayer::snapshot(int rotate, QObject *render)
{
mdk::Player::SnapshotRequest sr{};
player->snapshot(&sr, [this, rotate](mdk::Player::SnapshotRequest * sr2, double) {
QImage image = QImage(sr2->data, sr2->width, sr2->height, Format_RGB);
//如果有旋轉角度先要旋轉
VideoHelper::rotateImage(rotate, image);
emit imageCaptured(image.copy());
return std::string();
}, render);
}
void MdkPlayer::record(const QString &fileName, const QString &format)
{
player->record(fileName.toUtf8().constData(), format.toUtf8().constData());
}
void MdkPlayer::readMetaData()
{
//標題/藝術家/專輯/專輯封面
QString title, artist, album;
mdk::MediaInfo mediaInfo = player->mediaInfo();
std::unordered_map<std::string, std::string> metadata = mediaInfo.metadata;
for (auto i = metadata.begin(); i != metadata.end(); i++) {
QString key = QString::fromStdString(i->first);
QString value = QString::fromStdString(i->second);
if (key == "title") {
title = value;
} else if (key == "artist") {
artist = value;
} else if (key == "album") {
album = value;
}
}
QString format = mediaInfo.format;
emit receiveMetaData(format, title, artist, album);
}
void MdkPlayer::readAudioInfo(int index)
{
std::vector<mdk::AudioStreamInfo> audios = player->mediaInfo().audio;
if (index >= 0 && audios.size() > index) {
mdk::AudioStreamInfo audio = audios.at(index);
mdk::AudioCodecParameters para = audio.codec;
emit receiveAudioInfo(audio.index, para.sample_rate, para.channels, para.profile, para.bit_rate, para.codec);
}
}
void MdkPlayer::readVideoInfo(int index)
{
std::vector<mdk::VideoStreamInfo> videos = player->mediaInfo().video;
if (index >= 0 && videos.size() > index) {
mdk::VideoStreamInfo video = videos.at(index);
mdk::VideoCodecParameters para = video.codec;
//取出封面
QImage image;
if (video.image_size > 0) {
image = QImage::fromData(video.image_data, video.image_size);
}
emit receiveVideoInfo(video.index, para.width, para.height, para.frame_rate, video.rotation, para.codec, image);
}
}
void MdkPlayer::readTrackInfo(QList<int> &audioTracks, QList<int> &videoTracks)
{
mdk::MediaInfo mediaInfo = player->mediaInfo();
audioTracks.clear();
std::vector<mdk::AudioStreamInfo> audioTrackInfo = mediaInfo.audio;
foreach (mdk::AudioStreamInfo info, audioTrackInfo) {
audioTracks << info.index;
}
videoTracks.clear();
std::vector<mdk::VideoStreamInfo> videoTrackInfo = mediaInfo.video;
foreach (mdk::VideoStreamInfo info, videoTrackInfo) {
videoTracks << info.index;
}
//可能獲取到的索引是 音頻(3, 4, 5) / 視頻(0, 1, 2)
//底層設置節目流按照 0/1/2 這樣排列/所以需要強制矯正
int count = videoTracks.count();
audioTracks.clear();
videoTracks.clear();
for (int i = 0; i < count; ++i) {
audioTracks << i;
videoTracks << i;
}
}
void MdkPlayer::setAudioTrack(int track)
{
std::set<int> tracks;
tracks.insert(track);
player->setActiveTracks(mdk::MediaType::Audio, tracks);
}
void MdkPlayer::setVideoTrack(int track)
{
std::set<int> tracks;
tracks.insert(track);
player->setActiveTracks(mdk::MediaType::Video, tracks);
}
void MdkPlayer::renderVideo(QObject *render)
{
player->renderVideo(render);
}
void MdkPlayer::setVideoSurfaceSize(int width, int height, QObject *render)
{
this->render = render;
player->setVideoSurfaceSize(width, height, render);
connect(render, SIGNAL(destroyed(QObject *)), this, SLOT(clear(QObject *)), Qt::ConnectionType(Qt::DirectConnection | Qt::UniqueConnection));
}
void MdkPlayer::clear(QObject *render)
{
player->setVideoSurfaceSize(-1, -1, render);
}