OpenCV学习笔记之五：视频读取写入

原創

king110108

2020-03-31 17:08

用 OpenCV 开发难免会针对 Camera 或者是 Video 做处理，有的时候需要将画面保留下来，这个时候最佳方案是保存成一个 .avi 的文件。

OpenCV 底层是用 FFMEPG 进行多媒体开发的，所以 OpenCV 它的长项不在于此，它只是提供了这种能力而已，如果要针对多媒体文件做复杂的处理，推荐的还是 FFMEPG 专业库。

OpenCV 用来创建视频文件的类是 VideoWriter。

但首先，给大家普及一些视频类相关的知识点。

1. 文件后缀名

我们一般都知道视频文件是 .mp4、.3gp、.rmvb 等等格式的，但一个文件取这样的后缀名是为了告诉用户或者操作系统，它的内容是什么格式的。我们也可以将 rmvb 格式的文件取名为 ***.avi。后缀的目的是为了方便用专业的工具或者软件操作它们。

2. 文件格式

我们可以将一个视频文件看做一个容器。

简单地说就是可以看做是一个盒子。

这个盒子里面有视频画面数据、音频数据、字幕数据等等。

3. 编码格式

视频容器中，一般有视频和音频数据，它们采取的编码方式不一样。

视频常见的编码方式通常有： x264、h264、mpeg-4

音频常见的编码方式通常有： mp3、AAC、flac

编码的目的主要是为了高效存储和传输，如果你不采用编码压缩的话，那么视频可以看做是一系列的图片序列，体积会非常大。

4. 编码器和解码器

把视频或者音频按照编码格式，编码成特定文件格式需要编码器的参与，不然每次开发重新写代码代价很高。

把特定文件格式解码成特定的编码格式数据，这个过程称为解码，需要解码器的存在。

解码器和编码器都有开源的或者收费的工具库，极大方便了开发者。

5. FPS 帧率

我们读初中物理时，大概了解过电影画面一秒钟 24 帧，其实对应的就是 24 fps，frame per second，有些手机有高速摄像的功能，原理就是能够 1 秒钟拍摄 960 张图片，然后用正常的速度放映出来，所以细节比较多。

fps 越高，细节越好，体验也越好，但是文件容量也越高。

不同的文件格式如 mp4、avi、mkv 等等，它们存放打包数据的方式不一样，文件内部文件编码方式也可能不一样。

6.VideoWriter

用 OpenCV 保存视频非常简单，通过调用它的 VideoWriter类。详细函数格式 VideoWriter(filename, fourcc, fps, frameSize[, isColor])。

第一个参数是要保存的文件的路径
fourcc 指定编码器
fps 要保存的视频的帧率
frameSize 要保存的文件的画面尺寸
isColor 指示是黑白画面还是彩色的画面

7.一些其他细节

通过摄像头捕捉读入视频，获取第一个摄像头cv2.VideoCapture(0)，如果有多个摄像头可以修改参数，比如改成1是第二个摄像头。

视频编解码器VideoWriter_fourcc，fourcc意思为四字符代码(Four-Character-Codes),顾名思义该编码由4个字符组成，下面是VideoWriter_fourcc对象的一些常用参数，注意：字符顺序不能弄混。

cv2.VideoWriter_fourcc('I', '4', '2', '0'),该参数是YUV编码类型，文件名后缀为.avi
cv2.VideoWriter_fourcc('P', 'I', 'M', 'I'),该参数是MPEG-1编码类型，文件名后缀为.avi
cv2.VideoWriter_fourcc('X', 'V', 'I', 'D'),该参数是MPEG-4编码类型，文件名后缀为.avi
cv2.VideoWriter_fourcc('T', 'H', 'E', 'O'),该参数是Ogg Vorbis,文件名后缀为.ogv
cv2.VideoWriter_fourcc('F', 'L', 'V', '1'),该参数是Flash视频，文件名后缀为.flv

fourcc 本身是一个 32 位的无符号数值，用 4 个字母表示采用的编码器。常用的有 “DIVX"、”MJPG"、“XVID”、“X264"。

推荐使用 ”XVID"， cv2.VideoWriter_fourcc(*'XVID')，但一般依据你的电脑环境安装了哪些编码器。

8.代码示例

#!/usr/bin/env python 
# -*- coding: utf-8 -*-
# @Time    : 2020/3/29 10:11
# @Author  : King110108
# @File    : webcame.py
# @Description: 
# @IDE     : PyCharm

import cv2

cap = cv2.VideoCapture(0) #读取摄像头,0为摄像头索引，当有多个摄像头时，从0开始编号
fourcc = cv2.VideoWriter_fourcc(*'XVID') #创建视频流写入对象，VideoWriter_fourcc为视频编解码器
#fourcc意为四字符代码（Four-Character Codes），顾名思义，该编码由四个字符组成,下面是VideoWriter_fourcc对象一些常用的参数，注意：字符顺序不能弄混
# cv2.VideoWriter_fourcc('I', '4', '2', '0'),该参数是YUV编码类型，文件名后缀为.avi
# cv2.VideoWriter_fourcc('P', 'I', 'M', 'I'),该参数是MPEG-1编码类型，文件名后缀为.avi
# cv2.VideoWriter_fourcc('X', 'V', 'I', 'D'),该参数是MPEG-4编码类型，文件名后缀为.avi
# cv2.VideoWriter_fourcc('T', 'H', 'E', 'O'),该参数是Ogg Vorbis,文件名后缀为.ogv
# cv2.VideoWriter_fourcc('F', 'L', 'V', '1'),该参数是Flash视频，文件名后缀为.flv

out = cv2.VideoWriter('output.avi', fourcc, 20.0, (640, 480)) #设置视频参数, 20为帧播放速率，640x480是视频输出窗口大小

while True:
    ret, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) #转为灰度
    out.write(frame) #写入视频
    cv2.imshow('frame', frame) #彩色显示
    cv2.imshow('gray', gray) #灰度显示

    if cv2.waitKey(1) & 0xFF == ord('q'):  #按q退出程序
        break

cap.release()
out.release()
cv2.destroyAllWindows()

这段代码的目的就是获取摄像头的视频流，然后保存到本地，帧率是 20fps，尺寸是 640x480.

需要注意的是在 VideoWriter 中指定的尺寸要和 write() 中写进去的一样，不然视频会存储失败的。

如果需要读取视频文件，那么就将 VideoCapture 指定文件路径。

如果，将图片序列合成为视频文件，其实原理也一样，一张一张读取，然后写到 VideoWriter 当中去。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

OpenCV学习笔记之五：视频读取写入

1. 文件后缀名

2. 文件格式

3. 编码格式

4. 编码器和解码器

5. FPS 帧率

6.VideoWriter

诈骗（杀猪盘）网站进行渗透测试

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

外行也能读懂的网络硬件设备功能原理速成

細說汽車電子通信總線之常見汽車電子串行通信總線(CAN、LIN、DSI、ISO-9141、SWCAN、J 1850)對比

淺析if (ConstantValue == Variable)的重要性

Golang輸出水仙花數

如何學習新的知識

Golang遍歷字符串輸出中文亂碼的解決辦法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結