其他
火山引擎总裁谭待解析超视频时代音视频架构建设与演进
互联网用户对视频有更极致的需求。用户不再仅仅满足于清晰、流畅的观看体验;对高清化、交互性、沉浸式体验有了更多诉求; 视频云渗透到更多“传统”行业。在电商、工业、教育、医疗不断涌现更多落地场景,这些场景对音视频架构带来功能、性能和安全层面不同的挑战。
基础设施底座:在边缘云底层网的能力上,覆盖数据中心、城市边缘、用户边缘和终端,实现从1ms 到 40ms的广域网络接入和边缘数据处理能力;在这之上,再通过云原生边缘操作系统,实现云边协同,能够一张大网混合调度; 数字基础服务:一方面在底层基础设施上,实现边缘计算、存储、网络和安全的平台封装;另一方面,在中心机房层面,也构建出对应的计算、存储系统,以及重要的数据分析平台。并在数据面和控制面进行打通; 视频云解决方案:在这个层面,将底层基础设施和技术平台进一步封装为3个中台:智能媒体生产中台、处理中台和播放中台,满足视频场景的端到端需求。然后再针对业务场景,在中台能力上提供点播、直播、RTC、云游戏等具体产品和解决方案,打造高清化、沉浸式、交互性的视频体验。
低延时与新应用的基础
在基础设施层,按边缘算力的分布层级,火山引擎优选全国各省市丰富的边缘资源和运营商网络,并按地理层级部署优质的单线、多线和BGP的节点。结合多种架构的硬件设备,如:X86、ARM服务器、智能网卡、GPU等,实现面向异构算力的边缘基础底座;
基于边缘基础设施底座,自研云原生边缘平台,提供边缘自治管理、核心系统组件管理,以及面向大规模部署的镜像服务能力。云原生边缘平台非常关键,有了这一层,才能灵活管理异构的计算和网络资源,真正实现边缘一张网调度; 在上层的边缘计算资源服务,火山引擎将边缘能力模块化,提供VPC、弹性IP、高性能负载均衡、防火墙等能力。并搭建了边缘计算资源服务层,按需提供不同的算力单元。比如:虚拟机、容器、网络、函数、渲染等一系列服务; 场景应用层纵向维度,配合云边管理和数据管理,实现业务的全域智能调度和实时数据分析。
超大规模、实时处理,中心架构的新挑战
AI与视频云的结合将是未来的方向。编解码等大量的计算需求,对集中式的计算和存储方式带来延迟和带宽过大的挑战。火山引擎应对超大规模的实时处理需求,基于ROI编码,对计算与存储架构进行了不断迭代。
ROI编码,其基本原理是用户对显著性区域的视频质量比较敏感,希望通过检测+编码来提升显著性区域画质,进而提升用户体验。ROI本身已经被广泛地研究和使用,火山引擎有两个核心优势。
ROI的分析模块:火山引擎基于字节跳动丰富的视频内容,包括PGC以及带有各种特效、滤镜的UGC内容,创建了自研的多场景数据库用于算法训练,叠加自建数据库和有效AI训练。ROI检测达到了很高的准确率。同时在性能成本上做了诸多优化,例如在GPU上1ms每帧的处理速度,在CPU上3ms每帧处理速度,实现多场景覆盖。
ROI编码算法:集成在自研的高效编码器上,有很好的压缩性能,能够达到非常好的效果。目前全面应用于字节跳动的视频业务,不仅取得带宽成本的收益,用户指标,包括平均观看时长等等也有显著的提升。
橙色系块为计算平台: 计算平台的设计初衷: 调度要足够快,做到毫秒级 有调度超大规模算力的能力,大于百万级核数 系统要足够稳定 能充分压榨已有算力,也能快速纳入额外弹性资源 因此计算平台使用了多级调度架构,能够在server、client和executor中并发执行,并且支持多云架构,充分利用弹性。 蓝色系块为存储系统相关: 应对海量的业务请求,快速响应,高可用 对存储的视频及视频衍生物提供足够灵活的元数据支持 解决好多IDC、多云和跨境数据的迁移,复制和治理 抹平对底层存储系统的依赖 存储系统的核心:
数据驱动极致视频体验
点击阅读原文,下载视频云白皮书。