查看原文
其他

【深度】无线局域网中增强3D视频传输的队列管理机制

2017-11-03 学术plus 学术plus


今日荐文

今日荐文的作者为中国信息通信研究院专家张义,赵旭,路博, 工业和信息化部信息通信管理局专家涂华,中国电子科学研究院专家李阳阳。本篇节选自论文《无线局域网中增强3D视频传输的队列管理机制》,发表于《中国电子科学研究院学报》第12卷第3期。

摘 要随着智能终端、平板电脑的普及,用户越来越多地通过Wi-Fi上网。与此同时,人们对视频业务的要求也不断提升,3D等技术给人们带来全新的视觉体验。相对于普通的2D视频,3D视频需要的传输带宽更大,如何在无线网络中提高3D视频的传输质量是一个值得研究的问题。我们提出了一种主动队列管理机制来增强3D视频在无线局域网中的传输质量,在视频业务层需要标识出视频数据的重要性,并将其映射到无线局域网中优先级不同的队列中,保护关键视频数据的传输,提高3D视频的传输质量。


关键词: 无线局域网;队列管理; QoS; 多媒体应用

引 言

随着智能终端、平板电脑等设备的普及,人们采用无线上网方式观看视频节目。视频业务对网络的传输时延和误码率都有较高的要求。但是无线环境下,由于用户运动、干扰等因素,无线带宽和误码率都难以满足视频传输的要求。无线传输中分组丢失将会对压缩的视频的播放有严重的影响。为了减少传输的信息量,视频编码器一般采用运动补偿算法压缩视频,视频分组在网络中的丢失和接收端视频恢复质量之间不是简单的线性关系。视频压缩流中帧在接收端解码时具有依赖关系,即使较少的网络分组丢失也可能造成大量成功传输的数据实际上变得不可用。避免视频关键分组的重传是提高视频传输质量的有效手段。


为了提供立体观感,研究者提出了多视角视频和交互式多视角视频。前者为人的左眼和右眼提供不同的角度的视频,通过相位视差带来3D效果;后者则允许用户实时切换观看视角,通过运动视差获得全方位“浸入式”立体效果。采用多视角编码方式,利用多个视角的图像相关性同时压缩多个视角的信息以提高编码效率,但是采用这种方式仍然需要传输多个视角的视频。交互式多视角视频则需要对每个视角分别编码和存储,在播放过程中根据用户的需求请求不同的视角图像即可,可以有效地降低传输带宽,但是在传输过程中则可能存在交互延时。为了提供更多的视点,研究者提出采用深度图像绘制技术(Depth Image Based Rendering, DIBR)借用摄像头采集的真实视角图像合成虚拟视角图像。根据用户与服务器之间的交互,交互式多视角视频提供了全方位多视角的3D立体用户体验。


为了提高视频传输的服务质量,主要有两种解决方法,分别是以端系统和以网络为中心的方法。以端系统为中心的方法,需要端系统估计网络的带宽,并实施的修改视频的压缩速率,这种方法已经得到了广泛的研究,但是端系统一般较为复杂。而以网络为中心的方法,在网络节点中通过修改传输的关键机制来改进视频的传输质量QoS。


队列管理作为在路由器中支持拥塞控制提供服务质量的机制,是网络的研究热点。早在1993年Sally Floyd等人提出了随机早期检测(Random Early Detection, RED)算法,它能根据在网络将发生拥塞的时候,主动丢弃队列中缓冲区的数据避免队列上溢出,这样使得TCP的拥塞控制机制能够及早发现网络拥塞以进入拥塞避免状态,有效地减少网络拥塞。但是在无线局域网中,为了提高网络的服务质量,研究者提出了增强分布式协调功能(Enhance Distributed Coordination Function, EDCF),它为不同的业务提供了差异性接入无线信道的机会,以保障实时业务的传输。但是上述机制仍然不能保障3D视频的传输。为此,我们提出了一种队列管理机制来提高无线局域网中视频业务的传输质量。


1. 相关研究工作

为了提高有线网络中视频流的传输质量,文[4]中提出了基于速率的RIO(Rb-RIO)队列管理算法。算法中将I帧、P帧和B帧分组映射到三个优先级类,其中,I帧表示关键帧,I帧可以完整保留画面,解码时只需要本帧数据就可以完成;P帧表示前向预测编码帧,P帧表示的是这一帧跟之前的一个关键帧(I帧)的差别,解码时需要用之前缓存的画面叠加上本帧定义的差别,生成最终画面;B帧表示双向预测内插编码帧。B帧是双向差别帧,也就是B帧记录的是本帧与前后帧的差别。根据分组优先级的差别修改RIO算法的丢弃概率。文[5]提出分层编码的视频业务,使用多等级RED(称作REDN3),将不同帧分组映射到WRED算法的不同的丢弃优先级中。这些区分视频流分组重要性的队列管理方法,根据视频编码中帧类型的不同,直接将视频分组按照帧类型映射到不同的优先级。


为了保障无线局域网不同业务的服务质量,研究者提出了EDCF[6]。它将业务分成8个不同的优先级(User Priorities, UP),它们被映射为4个用户类别(Access Categories,AC):音频业务(AC_VO),视频业务(AC_VI),尽力而为业务(AC_BE)和背景业务(AC_BK)。不同的AC有不同的队列和接入参数(AIFS[AC],CWmin[AC],CWmax[AC]和TXOP_limit[AC])。通过调节这些参数,就可以改变不同业务接入无线信道的机会和时长,提供差异性的服务。


尽管上述的队列管理机制可以应用到无线局域网场景下,通过修改EDCF队列的管理机制提高视频的传输质量,但是这种方案没有充分发挥EDCF多队列的性能。并且现有的研究没有考虑交互式多视角3D视频流的视角切换等特性。

图1 无线局域网交互式多视角视频传输框架


2. 系统模型

图1描述了推荐的无线局域网中多视角视频业务的传输模型。假定从不同视角的拍摄同一场景,并且每个视角都包括了平面和深度视频信息。这些视频数据都压缩并存储在服务器中。移动终端向服务器请求视频业务,相应的视频数据会从服务器通过互联网,无线接入点传送到移动终端。在传输过程中,终端会周期性或者非周期性地反馈用户的视角。当用户请求虚拟视角视频的时候,可以先下载两个相邻真实视角的视频,然后在客户端通过DIBR技术合成虚拟视角视频。


3. 队列管理操作

我们提出的队列管理机制结合了EDCF多队列的特征和自治的思想。自治机制的核心点是自治反馈控制环的形式。无线接入收集视频业务的队列的平均队列长度,根据这些信息判断网络的拥塞状况进行自适应的决策。同时在应用层标记视频编码的特征信息,包括帧类型,帧位置和帧大小等信息,需要在源端进行视频压缩编码后,记录到分组头的字段中。无线接入点中的视频队列管理机制根据缓冲区的情况,当网络将要发生拥塞的时候将不重要的分组塞入其它低优先级的队列中,避免关键视频分组由于队列溢出而被丢弃。如图2所示,在无线接入点的队列中,视频业务的缓冲区可能发生溢出,我们可以将不重要的非关键分组(如承载P、B帧的分组)动态地映射到其他的AC_BE和AC_BK队列中,最大限度地保护视频关键分组(如承载I帧的分组)的传输。

图2 队列管理机制示意图


在已有的RED、WRED[7]等队列管理算法中,算法的参数都是静态设置的。本算法则根据网络的状况动态调整视频分组的映射策略。具体说来,如图3所示:


图3 队列管理算法流程图


当任意视频分组进入AC_VI队列时,首先计算AC_VI和AV_BE队列缓冲区的长度,然后根据AC_VI队列缓冲长度和分组类型计算丢弃概率PV, 如果决定不丢弃分组,则将视频分组塞入AC_VI队列中。如果决定丢弃分组,则根据AV_BE队列缓冲区长度和分组类型计算丢弃概率PB,再次决定是否丢弃分组,如果决定不丢弃分组,则将视频分组塞入AV_BE队列中,否则塞入队列AC_BK中。 这种动态的队列管理机制最大限度地利用了EDCF多缓冲区队列的特征,充分地保护了关键分组的传输,同时并没有影响高优先级的音频业务服务质量,也尽量降低对BE和BK等业务的影响。


下面我们讨论如何计算丢弃概率PV和PB。对于RED和WRED算法,最重要的参数是分组最大丢包率maxp。本算法为了减少重要视频分组的丢失,根据分组的重要性来对最大丢包率进行调整。算法中初始设置的针对I帧分组、P帧分组和B帧分组的最大丢包率分别表示为maxp_i、maxp_p和maxp_b,而且三个数值依次增大已达到对重要分组的优先保护。


如果有I帧分组到达, maxp设置为maxp_i。如果有P帧分组到达,将根据P帧编号来调整maxp_p的值。如果当前分组是P帧分组,最大丢包率调整为maxp = maxp_i + (maxp_p – maxp_i) * a,a是一个常量。如果当前分组是B帧分组,最大丢包率调整为maxp = maxp_p + (maxp_b – maxp_p) * b,其中b是一个常量。算法中使用的静态参数包括:平均队列长度qvi,队列长度低门限th_min,队列长度高门限th_max,最大丢包率maxp_i、maxp_p和maxp_b。而使用的业务上下文信息则从到达分组头的相应字段中直接收集获取即可。当AC_VI平均队列长度qvi小于th_min时,直接使当前分组进入队列。当平均队列长度qvi大于th_max时,则选择分组进入AV_BE或者AC_BK队列。当平均队列长度在两个门限之间时,根据分组类别信息调整最大丢包率参数PV。如果决定分组不进入AC_VI队列中,则可以进入AC_BE或者AC_BK队列中。计算过程与上述判断分组是否进入AC_VI队列相似,不同之处在于统计的是AC_BE的队列长度qbe。


推荐的队列管理机制机制伪代码如表格1所示:

表格1 : 队列管理算法的伪代码

1. Loop 1: Should arrival packet be mapped to AC_VI queue:calculate the average queue length qvi and qbe

2. if the arrival packet carrying I frame data then

3.   maxp = maxp_i

4. else if the arrival packet carrying P frame data then

5.   maxp = maxp_i + (maxp_p – maxp_i) *a

6. else

7.   maxp = maxp_p + (maxp_b – maxp_p) * b

8. if  (qvi >= th_max) then

9.   go to Loop 2

10. else if (qvi < th_min) then

11.   enter the arrival packet into the queue AC_VI

12. else

13.   p = maxp * (qvi – th_min ) / (th_max – th_min)

14. randomize number uvi

15. if ( uvi<= p )

16.   go to Loop 2

17. else

18.   enter the arrival packet into the queue AC_VI.

19. Loop 2: Should arrival packet be mapped to AC_BE queue:

20. if the arrival packet carrying I frame data then

21.   maxp = maxp_i

22. else if the arrival packet carrying P frame data then

23.   maxp = maxp_i + (maxp_p – maxp_i) *a

24. else

25.   maxp = maxp_p + (maxp_b – maxp_p) * b

26. if  (qbe >= th_max) then

27.   enter the arrival packet into the queue AC_BK

28. else if (qbe < th_min) then

29.   enter the arrival packet into the queue AC_BE

30. else

31.   p = maxp * (qbe – th_min ) / (th_max – th_min)

32. randomize number ube

33. if ( ube<= p ) then

34.   enter the arrival packet into the queue AC_BK

35. else

36.   enter the arrival packet into the queue AC_BE


4. 仿真结果及分析

我们通过NS3的仿真验证推荐方法性能。假设多个用户同时请求多视角视频业务。


采用H.264 JM编码视频序列"Kendo"和"Balloons"[8]。其中。所有视频采用了前240帧并将视频重复播放10遍,仿真实验中涉及两个参数GoP (Group of Picture 图像组)和QP(Quality Parameters 量化参数)。其中,GoP表示图片组中帧的个数,即I帧的间隔数,一般为8-64,GoP设置过小,视频压缩比太小,GoP设置过大,I帧之间的预测帧补偿还原效果太差;QP表示视频压缩的量化参数,直接决定视频的压缩比,QP越大,视频的压缩比越大,生成视频的码率越低。根据实验和经验值,我们设置GoP和QP为分别为16和32[9]。视频Kendo的平均码率值为820Kbps,视频Balloons的平均码率值为840Kbps。用JM将视频的深度信息压缩为100Kbps。仿真中,MPEG虚拟视角合成软件MPEG VSRS用来合成虚拟视角。在仿真过程中,视点1,3和5为真实视点,视点2和4为虚拟视点。该仿真采用了文献[10]中的视点切换模型,该文献中视角切换模型是相关作者在大量实验数据基础上,对人们进行视角切换规律的分析和总结,即一般而言用户会保持相同的视角切换轨道。这个视角模型假定用户会保持相同的视角切换轨道。如图4所示,如果用户在第i-1个时刻观看的视频角度是1,在第i个时间分片观看的角度为2,那么用户在第i+1个时刻观看视点1、2和3的概率分别为(1-P2-P3)、P3和P2。如果用户在第i-1个时刻观看的视频角度是2,在第ii个时间分片观看的角度为2,那么用户在第i+1个时刻观看视点1、2和3的概率分别为(1-P1)/2、P1和(1-P1)/2。


图4 视角切换模型


我们使用NS3在WLAN场景下进行仿真,分析比较默认EDCF算法和推荐方法的性能。队列管理算法部署在无线接入点队列管理机制上。仿真拓扑中的10个无线终端在规定的1000x1000区域内随机移动。我们使用NS3提供的随机路点移动模型(random waypoint mobility mode, RWP)。仿真场景中无线信道设置为双径路损模型和瑞丽衰退模型。


仿真中我们推荐的算法中maxp_i, maxp_p, maxp_分别设置为0,0.4和0.8,th_min和th_max分别设置为30和60。本文仿真实验中 a  b分别选取0.5 , 1,它们会对不同分组的丢弃概率产生影响。这两个值越大,分组的丢弃概率越大,分组在网络拥塞的时候被主动丢弃的概率越大。一般而言,b应该取值比a大,这样对承载关键帧的分组保护力度越大。


图5展示了推荐算法的性能,采用EDCF方法和我们推荐的方法kendo视频的平均PSNR为36.3和37.7dB, Balloons视频的平均PSNR为31.9和34.0dB。我们可以看出推荐的方法能够有效地提高交互式多视角视频在无线局域网的传输质量。


       (a)                        (b)

图5 算法性能比较(a) Kendo (b) Balloons


5. 结论

本文中提出了一种队列管理机制以提高交互式多视角3D视频流传输质量。能够根据视频流分组的编码特征信息决定分组的重要性,自适应地调整机制参数,保护重要的视频数据。最后使用NS3仿真比较了传统的EDCF机制和我们推荐的队列管理算法性能。仿真结果显示推荐算法能够获取更优的PSNR。


 

(参考文献略)



《 召 集 令 

身怀学术绝技的你速速前来!


1,有学术水准:一定的专业学术水准是必须的!

2,有独到思想:具深度,广度,锐度者为最佳!

3,内容范畴:自然科学,社会科学等等不设限!

4,资讯或翻译类文章:符合上述条件的均可以。


学术plus咨询/投稿邮箱

xueshuplus@163.com





声明:版权归《中国电子科学研究院学报》所有。转载请务必注明出处,违者必究。文章观点不代表本机构立场。



  • 《中国电子科学研究院学报》欢迎各位专家、学者赐稿!投稿链接 http://kjpl.cbpt.cnki.net

  • 电话:010-68893411

  • 邮箱:dkyxuebao@vip.126.com


数据链中消息标准的标准化研究(上)美军数据链信息标准全解析

数据链中消息标准的标准化研究(下)美军数据链消息标准的管理以及对我军的启示

一种应用于多功能雷达的低成本收发系统设计

资源受限条件下的大规模网络构建方法

基于半实物平台的战场复杂电磁环境信号生成与实现:信号构成与实现方法

基于半实物平台的战场复杂电磁环境信号生成与实现: 信号生成方法与综合建模技术

美智库发布《首次打击——中国对美国在亚洲多个军事基地的导弹威胁》

美智库分析:具有中国特色的中国人民解放军火箭军

美智库分析:新时代的来临(组图)

美智库分析:中国是否有能力进行一次先发制人的导弹袭击?

美智库分析:中国人民解放军火箭军实施导弹打击的目标与所需库存评估

美智库分析:中国人民解放军火箭军精确打击能力的建模与仿真

2017文章全收录(3月)一篇文章满足你

2017文章全收录(1-2月)

2016文章全收录 · 信息与电子前沿

DARPA的13个科研成果转化项目

DARPA2016年最受关注的10大项目

DARPA的关键研究领域:信息,生物,技术边界

只要内容过硬,其他都无所谓的,2016微信大调查

两院院士:评选2016年中国、世界10大科技进展

15张图看未来30年科技改变社会

未来30年,塑造社会变化的6个关键趋势

美国陆军报告:未来30年,影响世界的24个核心科技趋势

麻省理工科技评论:2016年十大突破技术

新视点:漫谈面向未来之颠覆性技术

新视点:美国国家创新体系发展进程概览

新视点:中美在网络空间如何达成共识:一种建构主义视角

新视点:特朗普大选获胜是颠覆式创新的胜利

新视点:透过数据看美国国防科技创新体系(三)

新视点:智慧城市就是更多参与

新视点:漫谈面向未来之战略前沿技术




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存