原创 ffmpeg關鍵結構體關係

1、ffmpge中關鍵結構體 2、關係 3、參考 《1》、ffmpeg幾個重要結構體間關係

原创 live555使用整理

   live555使用、學習及遇到的問題的整理。 1、live555模塊 《1》、UsageEnviroment模塊   系統環境的抽象,主要用於消息的輸入輸出和用戶交互功能,包含抽象類UsageEnviroment,TaskSc

原创 ffmpeg 視頻解碼流程及對應API使用

1、ffmpeg解碼流程 《1》、ffmpeg舊接口的解碼流程 《2》、新接口解碼流程   注意在新接口流程中使用avcodec_parameters_to_context函數來初始解碼器參數,在未加入該步驟之前解析avi封裝的m

原创 tinyxml2 讀取到xml文件的中文亂碼處理

遇到問題: xml文件中含有中文的文件路徑,經過tinyxml2解析打印後亂碼。 1、tinyxml2解析xml文件時默認是按照utf8格式讀取的。 2、解析含有中文的xml的亂碼解決   由1知道tinyxml2解析默認是utf8

原创 ffmpeg解析MP4封裝的avc1編碼問題

0、問題   遇到的問題:使用ffmpeg直接讀取avc1編碼的mp4視頻,將讀取到的幀寫下來(H264碼流),播放失敗。   原因: ffmpeg解碼獲取的AVPacket只包含視頻壓縮數據,並沒有包含相關的解碼信息(比如:h264

原创 pytorch數據加載、模型保存及加載

主要涉及的Pytorch官方示例下圖紅框部分的一些翻譯及備註。 1、數據加載及處理   該部分主要是用於進行數據集加載及數據預處理說明,使用的數據集爲:人臉+標註座標。demo程序需要pandas(讀取CSV文件)及scikit-i

原创 Pytorch基礎

大部分來源 中文pytorch手冊或英文pytorch手冊及 PracticalAI 項目。 Pytorch是一個基於python的科學計算包,其目的是:   a、代替Numpy發揮GPU性能;   b、提供一個高度靈活和極具效率的深

原创 Haar特徵+Adaboost人臉識別C實現

Haar特徵+Adaboost的人臉識別C實現,部分簡單的功能借助Opencv實現,數據是MIT人臉數據。 程序的實現主要是參考《Rapid Object Detection using a Boosted cascade of si

原创 KLT光流跟蹤demo

1、KLT光流 《1》、光流指運動物體在像素平面上的瞬時速度,它利用圖像序列中像素在時間域上的變化以及相鄰幀之間的關係來找到上一幀跟當前幀之間存在的對應關係,從而計算出相鄰幀之間物體的運動信息的一種方法。 《2》、KLT光流假設 1、

原创 linux下 單調時間(另附牆上時間、CPU時間)

1、單調時間     linux下編寫應用程序時,涉及到時間獲取有多個函數可以選擇,這些常用獲取時間函數之間的差異: 《1》、 time 該函數返回自1970來的秒數,精度過低; 《2》、gettimeofday   該函數返回自19

原创 C語言不定參數的兩種實現

1、使用以下三個函數可實現不定參數 #include<stdarg.h> void va_start(va_list ap, last); type va_arg(va_list, type); void va_end(va_lis

原创 linux 下文件同步函數(fflush、sync、fsync、fdatasync)之間差異

遇到機器異常關機時,寫log文件信息丟失問題,所以記錄下。   Linux實現中在內核設有緩衝區高速緩存或頁面高速緩存,大多數磁盤I/O都通過緩衝區進行。當我們向文件寫數據時,內核通常先將數據複製到一個緩衝區中,如果該緩衝區尚未寫滿,

原创 YUV圖解 (YUV444, YUV422, YUV420, YV12, NV12, NV21)-- 轉

YUV圖解 (YUV444, YUV422, YUV420, YV12, NV12, NV21)

原创 shell中${}用法

${}配合#及%使用達到字符串中特定位置字符刪除操作 假設有一個變量: file=/dir1/dir2/fir3/my.file.txt 1、使用${}刪除特定位置字符後得到不同的值 ${file#*/}:刪掉第一個/及其左邊的字符

原创 梯度下降算法的解釋及直觀展示

梯度下降算法的解釋及直觀展示: 1、各種梯度優化算法介紹(SGD Loss劇烈波動) 2、梯度下降優化算法綜述