从RTSP协议传输的H264视频流中取出每一帧的类型(I、P、B帧)

从RTSP协议传输的H264视频流中取出每一帧的类型(I、P、B帧)

本站内容版权属于本人。转载须告知本人,写明出处,并在文首提供指向本站对应文章的链接。
本文链接:从RTSP协议传输的H264视频流中取出每一帧的类型(I、P、B帧)

RTSP是一个控制协议,其中的数据是用RTP传输的。
RTP使用了UDP,每个UDP包的内容区(没有UDP头)都包含以下的几个部分:

V: 版本
P: 填充标志,占1位,如果P=1,则在该报文的尾部填充一个或多个额外的八位组,它们不是有效载荷的一部分。
X:扩展标志,占1位,如果X=1,则在RTP报头后跟有一个扩展报头。
CC: CSRC的个数
M: 对于H264视频帧,表示这是最后一个分片
PT: 载荷类型,H264是96(0x60)
SSRC: 会话标识
CSRC: 忘记了

紧随其后的是NALU_HEADER

F: 始终为0
NRI: 重要性
Type: 类型

如果H264的Slice过大,无法装入一个UDP包中,一般来说这里就要分包。分包时,NALU_HEADER中Type字段为FU-A(28),下一字节为FU_HEADER。

S: 开始的片
E: 结束的片
R: 始终为0
Type: 类型,和NALU_HEADER的类型一致

后面的部分就是H264的内容了。H264是按照Slice传输的,每个Slice有一个Slice头,据说Slide头使用了指数哥伦布编码(k=0),需要先进行解码。
指数哥伦布编码(k=0):

解码就反过来,先数0的个数,然后再取相应位数的数据出来。
011110100001101 -> 011 1 1 010 0001101 -> 11 1 1 10 1101 -> 3 1 1 2 13 -> 2 0 0 1 12

Slide头的第二个参数为slice_type,也就是解出来的第二个数,表示IPB帧:

参考:
[1] http://blog.csdn.net/jefry_xdz/article/details/8461343
[2] http://www.cnweblog.com/fly2700/archive/2012/02/23/319718.html
[3] http://blog.csdn.net/wangjiannuaa/article/details/6966505
[4] http://blog.sina.com.cn/s/blog_4171e65d0100o4pt.html
[5] http://baike.baidu.com/view/1268656.htm?fromtitle=RTP&fromid=8974125&type=syn

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

*

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据