李青源:高清体验和带宽节省,瞄准方向深耕
The following article is from LiveVideoStack Author 李青源
本文转自 / LiveVideoStack
作者 / 李青源
在LiveVideoStackCon 2018前夕,金山云资深产品专家李青源接受了LiveVideoStack的采访。他聊到了金山云在“视频+AI”和“编解码”方向的探索,致力于为终端观众提供更高清的视觉体验,为B端客户最大化的节省传输成本。
LiveVideoStack:李青源你好,能否向LiveVideoStack的读者介绍下自己,以及目前主要的工作以及关注的技术方向?
李青源:大家好,我是李青源,和LiveVideoStack多数技术大牛们的背景稍稍不同,我是一位“产品经理”。从2010年开始一直在做平台和商业产品相关,现在金山云担任资深产品专家,主要负责视频云产品, 包含“视频+AI”新方向探索以及编解码KSC265的产品化应用。
视频的高清化、智能化是大势所趋,我们团队会重点去关注,如何将“编码”、“AI”、“传输”三者有机的结合在一起,为终端观众提供更高清的视觉体验,为B端客户最大化的节省传输成本,在这个方向上会持续的投入和研究。
LiveVideoStack:AI在多媒体领域有许多应用实现?这是为什么呢?
李青源:简单来看,AI意味着计算机变的更智能、更聪明,从海量数据中学习然后应用在一个细分领域成为“专家”。而多媒体领域,“媒体即数据”,多媒体天然就是海量数据的土壤。因此我认为,这是两者碰撞在一起可以产生更大能量的本质原因。
我们也看到了行业许多已落地的应用,“智能审核”、“智能编辑”等大幅解决了效率问题,“语音识别”、“画质增强”等提供了更好的服务和用户体验...不多列举了,AI在多媒体领域的应用前景广阔。
LiveVideoStack:您看好AI在多媒体生态中的哪些环节的应用,比如前处理、编码、网络算法、后处理等?
李青源:除了算法本身外我们很关注目标客户场景、研发投入产出比、落地可行性等,因此在不同情况下有不一样的侧重点。我们不会自己“闭门造车”,更多是跟着头部客户的诉求和场景在走,所以回头来看投入最多的是AI前处理方面。
举个例子,为了提升视频主观画质,编码中的感知编码技术非常多,宏块级、帧级都有覆盖,而这些技术往往还与码率控制缠绕在一起,进而导致尝试一个新的算法在研发过程中容易牵一发而动全身。而AI前处理有很大的探索空间,所受到的束缚也更少,还可以应用于不同编码标准。有时我们在AI前处理投入相对少的资源,便能实现超出预期的效果。
LiveVideoStack:能否介绍下金山在视频编解码、窄带高清、图像增强等方面的探索?
李青源:产品演进的过程中,我们不断在思考视频行业的痛点,作为云计算厂商,哪些是我们擅长的,有选择的去深耕。后来我们聚焦到行业的一个“矛盾点”上:“终端观众对高清体验的不断追求"与“视频厂商不断攀升的带宽成本压力”与“移动运营商网络更新换代缓慢”,他们三者之间的矛盾代表了这个行业的一大痛点,也是我们擅长的、要解决的关键问题。
KSC265编解码是金山云的优势能力,相比开源的X265在相同速度下性能有较大优势。同时,我们还在产品上经过的细致的打磨和市场验证,可以说是业内最完善的全链路、全终端支持H.265的产品解决方案。
KIE画质增强是我们在图像AI方向的探索,通过超分辨率、图像细节修复等技术,让画质变的更清晰。现在已经成功应用于小米MIUI的最新版本。并且它的应用场景非常非常广泛,可以是硬件终端,如手机,相机;也可以是各类手机APP、移动浏览器等,这个点让我们感到很兴奋。
在视频高清方面,我们比较关注人眼感受的研究,除了常见的感知编码、Per-title、ROI 等技术外,我们更关心光影变化与色彩、图像细节感知、恰可失真码率决策等,实现“欺骗”人眼来达到画质的提升以及带宽的节省。比如,我们发现人眼对光影变化极其敏感,但是人眼本身有消除灯光频闪的功能,因此我们对摄像头拍摄视频中的光影进行建模,过滤掉人眼察觉不到的频闪导致反射光的变化达到码率节省。集智高清,是我们即将推出的一款重点产品,后续有机会可以针对性详细交流。
LiveVideoStack:在对接头条、虎牙、熊猫等接入KSC265的过程中,遇到了哪些挑战?是如何完善、改进的?
李青源:挑战很大,收获也颇多,我们不仅仅要关注KSC265的编解码性能提升,同时要花更多精力去完善产品的易用性,终端兼容性等,这些点同样重要。关于这块,我会在LiveVideoStackCon 2018 和大家去分享KSC265应用过程中的心路历程。
LiveVideoStack:最后一个问题,能否剧透下在LiveVideoStackCon 2018上将要分享的话题。
李青源:我在LiveVideoStackCon 2018分享的主题是“KSC265的全链路解决方案和应用”,更多会从产品的角度去讲述,我们做了哪些事情,这些产品上的迭代给客户带来了哪些应用价值!技术塑造视界,产品创造价值,缺一不可。
- FIN -