流媒体传输 - RTP 荷载 H265
H265 码流结构
H265 码流和是由很多 NAL Unit 组成,所有 NAL Unit 均存在一个 16 位数据的 NAL Unit Header ,一个 NAL Unit Header 的语法如下:
+---------------+---------------+
|0|1|2|3|4|5|6|7|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|F| Type | LayerId | TID |
+-------------+-----------------+
Figure 1: The Structure of the H265 NAL Unit Header
- F: 1bit forbidden_zero_bit,在 H.265 规范中规定了这一位必须为 0。它的作用是在尚存 MPEG-2 系统环境中,防止产生可以解释为 MPEG-2 起始码的比特模式。
- Type: 6bit 其允许的 NAL Unit 的类型编码比 H264 多一倍,达到了 64 类,其中 32 类作用于 VCL NAL Unit,32 类作用于 non-VCL NAL Unit。
- LayerId: 6bit 用于 H265 拓展层标识符
- TID: 3bit temporal_id,表示 H265 的接入单元(AU)属于哪个时域子层,时域标识符值为 0 到 6。
H265 码流打包
RFC 7798 Section 4.4 指定了四种不同类型的 RTP 数据包有效负载结构:
单 NAL 单元模式(Single NAL Unit Packet): 仅包含单个 NAL Unit 的有效载荷。
组合封包模式(Aggregation Packet):用于聚合多个 NAL Unit 的分组类型成为单个 RTP 有效负载。
分片封包模式(Fragmentation Unit):用于将单个 NAL Unit 分段成多个 RTP 数据包。
携带 RTP 数据包的 PACI:包含有效载荷报头(与其他有效载荷报头有所不同),有效载荷报头扩展结构(PHES)和 PACI 有效载荷。
其中常用的有两种类型:单 NAL 单元模式和分片封包模式。
单 NAL 单元模式
一个 RTP 包仅由一个完整的 NALU 组成. 这种情况下 RTP 的 NAL 头类型字段 PayloadHdr 和原始的 H.265 的 NALU Header 字段是一样的。
对于 NALU 的长度小于 MTU 大小的包, 一般采用单一 NAL 单元模式。一个原始的 H.264 NALU 单元常由 [Start Code] [NALU Header] [NALU Payload] 三部分组成, 其中 Start Code 用于标示这是一个 NALU 单元的开始, 必须是 "00 00 00 01" 或 "00 00 01", NALU 头仅一个字节, 其后都是 NALU 单元内容,打包时去除 "00 00 01" 或 "00 00 00 01" 的开始码, 把其他数据封包为 RTP 包即可。
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| PayloadHdr | DONL (conditional) |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| |
| NAL unit payload data |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure 3: The Structure of a Single NAL Unit Packet
分片封包模式
分片封包模式(FU)能将单个 NAL 单元分段成多个 RTP 数据包。
NAL 单元的片段由该 NAL 单元的整数个连续八位位组组成。 分片封包的 NAL 单元必须以升序的 RTP 序列号连续顺序发送(同一 RTP 流中的其他 RTP 数据包不得在第一个片段与最后一个片段之间发送)。
FU 绝对不能嵌套; 即,FU 一定不能包含另一个 FU 的子集。
携带 FU 的 RTP 分组的 RTP 时间戳被设置为分段 NAL 单元的 NALU 时间。
FU 由一个有效负载报头(PayloadHdr),一个 8bit 的 FU Header,一个有条件的 16 位 DONL 字段和 FU 有效负载组成,如下图所示。
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| PayloadHdr (Type=49) | FU header | DONL (cond) |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-|
| DONL (cond) | |
|-+-+-+-+-+-+-+-+ |
| FU payload |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure 9: The Structure of an FU
PayloadHdr 的字段含义与 NALU Header 的字段含义一直,其各字段设置为: - Type 字段必须等于 49 - 字段 F,LayerId 和 TID 必须分别等于分段的 NAL 单元的字段 F,LayerId 和 TID
FU header 包含 1bit 的字段 S,1 字节的字段 E 和 6bit 的字段 FuType:
+---------------+
|0|1|2|3|4|5|6|7|
+-+-+-+-+-+-+-+-+
|S|E| FuType |
+---------------+
Figure 10: The Structure of FU Header
- S: 1bit 当设置为 1 时,S 位指示分段 NAL 单元的开始,即 FU 有效载荷的第一个字节也是分段 NAL 单元的有效载荷的第一个字节。 当 FU 有效载荷不是分段式 NAL 单元有效载荷的开始时,必须将 S 位设置为 0。
- E: 1bit 当设置为 1 时,E 位表示分段 NAL 单元的末尾,即有效载荷的最后一个字节也是分段 NAL 单元的最后一个字节。 当 FU 有效负载不是分段的 NAL 单元的最后一个分段时,E 位务必设置为 0。
- FuType: 6bit 字段 FuType 必须等于分段的 NAL 单元的字段 Type。