FFmpeg入门教程09.04:YUV格式介绍

系列索引:FFmpeg入门系列索引

最近一直在搞视频解码这一块的东西,为了方便,我整合一下所有的关于YUV相关的内容,方便以后查找。

YUV是真彩色(true-color)颜色空间(color space)的一类,Y’UV/YUV/YCbCr/YPbPr等专有名词都可以称为YUV,彼此有重叠。“Y”表示明亮度(Luminance或Luma),也就是灰阶值,“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。

YUV

那么YUV又从何而来呢?在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD摄像机进行摄像,然后把摄得的彩色图像信号经分色、分别放大校正后得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号R-Y(即U)、B-Y(即V),最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这种色彩的表示方法就是所谓的YUV色彩空间表示。

采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图像就是黑白灰度图像。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题,使黑白电视机也能接收彩色电视信号。

YUV420

YUV420格式是指,每个像素都保留一个Y(亮度)分量,而在水平方向上,不是每行都取U和V分量,而是一行只取U分量,则其接着一行就只取V分量,以此重复(即4:2:0, 4:0:2, 4:2:0, 4:0:2 …),所以420不是指没有V,而是指一行采样只取U,另一行采样只取V。在取U和V时,每两个Y之间取一个U或V。但从4x4矩阵列来看,每4个矩阵点Y区域中,只有一个U和V,所以它们的比值是4:1。所以对于一个像素,RGB需要8 * 3 = 24位,即占3个字节;而YUV420P,8 + 8/4 + 8/4 = 12位,即占2个字节,其中8指Y分量,8/4指U和V分量。

从这里也可以看出,YUV要比RGB节省存储空间。

这里为什么一个分量是8位呢?

不管是R G B还是 Y U V他们每个分量的取值都是0-255,而计算机都是用二进制来存储的。巧了,一个字节(8bit)刚好可以记录0-255的数,所以刚好就是这样存了吧。

对于所有YUV420图像,它们的Y值排列是完全相同的,因为只有Y的图像就是灰度图像。YUV420sp与YUV420p的数据格式它们的UV排列在原理上是完全不同的。420p它是先把U存放完后,再存放V,也就是说UV它们是连续的。而420sp它是UV、UV这样交替存放的。

U为Cb,V为Cr。

首先要知道YUV究竟有多少种格式,我从FFmpeg和mpp库中提取了它们所支持的所有YUV格式。FFmpeg头文件中libavutil/pixfmt.h,64行开始是显示格式相关的。包括:YUV420P/YUYV422/YUV422P/YUV444P/YUV444P/YUV410P/YUV411P/YUVJ420P/YUVJ422P/YUVJ444P/UYVY422/UYYVUU411/NV12/NV21/YUV440P/YUVJ440P/YUVA420P/NV16/NV20/YVYU422/,同时也包括一些10bit等等之类的版本。

其中SP表示Semi-Planar,表示YUV不是分成3个平面而是分成2个平面。Y数据一个平面,UV数据合用一个平面。UV平面的数据格式是UVUVUV。

P有两种:打包(packed)格式和平面(planar)格式。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交叉存储的。前者将YUV分量存放在同一个数组中,通常是几个相邻的像素组成一个宏像素(macro-pixel)而后者使用三个数组分开存放YUV三个分量

YUV420P(planar格式)在ffmpeg中存储是在struct AVFrame的data[]数组中

1
2
3
data[0]-------Y分量
data[1]-------U分量
data[2]-------V分量

6*4的图片为例。

YUV420

每四个Y共用一组UV分量,一个YUV占8+2+2 = 12bits 1.5个字节。

YUV420SP(NV12)

像素排列:YYYYYYYY UVUV

每四个Y共用一组UV分量,一个YUV占8+2+2 = 12bits 1.5个字节。

nv12

图像大小为w * h,Y分量占用内存为w * h,UV占用w * h / 4。

那么整个YUV分量占用内存为w * h+(w * h / 4) * 2 = w * h * 3/2字节;

在运算中涉及到除法,而在读取数据中不可能读取0.5个字节,或者读取一个字节的部分数据。那么w和h必须为2的倍数,这样在运算中就不会出现异常。

YUV420SP_VU(NV21)

像素排列:YYYYYYYY VUVU

每四个Y共用一组UV分量,一个YUV占8+2+2 = 12bits 1.5个字节。

nv21

图像大小为w * h,Y分量占用内存为w * h,UV占用w * h / 4。

那么整个YUV分量占用内存为w * h+(w * h / 4) * 2 = w * h * 3/2字节;

YUV420P(I420/YU12)

像素排列:YYYYYYYY… UU… VV…

每四个Y共用一组UV分量,一个YUV占8+2+2 = 12bits 1.5个字节。

i420

图像的大小为w * h,Y分量占用大小为w * h,UV分量各占w * h / 4。

那么整个YUV分量占用内存为w * h + (w * h/4) * 2 = w * h * 3/2。

示例1:FFmpeg入门系列教程7:解码视频并保存为YUV格式文件(YUV420P/YUV420SP)
示例2:FFmpeg入门系列教程9:软解并使用QOpenGL播放视频(YUV420P->OpenGL)

YUV420P_VU(YV12)

像素排列:YYYYYYYY VV UU

每四个Y共用一组UV分量,一个YUV占8+2+2 = 12bits 1.5个字节。

yv12

YUV422

基于YUV 4:2:2采样,每两个Y共用一组UV分量,一个YUV占8+4+4 = 16bits 2个字节。

YUV422SP(NV16)

YUV422P

像素排列:YYYYYYYY VVVV UUUU

YUV444P

基于YUV 4:4:4采样,每一个Y对应一组UV分量,一个YUV占8+8+8 = 24bits 3个字节。


FFmpeg入门教程09.04:YUV格式介绍
https://blog.jackeylea.com/ffmpeg/the-introduction-of-yuv/
作者
JackeyLea
发布于
2020年7月12日
许可协议