查看原文
其他

中国移动科技成果日(第三十一期)| 音视频技术在数字内容领域的创新实践

中移科协 2023-02-13
LEAD为加强公司科技成果推广、促进成果转化、加强研发协同、实现成果应用,公司每月举办“科技成果日”活动,并将其作为中国移动科协常态化开展学术交流、科学普及、举办培训、助力人才成长的重要平台。“科技成果日”围绕新技术发展、新产品研发、在岗革新最佳实践等内容,在公司内部传播新技术、新知识,推广新产品、新服务。






随着中国移动数智化转型的推进, 公司数字内容产业正迈向个性化、体系化、融合化和精细化。为加速数字内容的运营与变现能力,充分释放技术成果对经营发展的倍增效应,高标准、高效能、高质量地助力中国移动CHBN“四轮”全面发力,第31期“科技成果日”设置为咪咕公司专场, 主题为“音视频技术在数字内容领域的创新实践”,一是对数字领域创新实践的经验作出分享,鼓励深耕音视频核心技术,提升行业竞争力,拓展新业务场景;二是对数字领域的相关能力进行推介,加快树立标杆应用,催生更多优秀案例。




1.咪咕视频云能力及解决方案

王智广



基于咪咕视讯十余年来在音视频领域的专业技术积累,咪咕团队将5G+超高清点直播端到端服务能力云化,打造了咪咕视频云能力服务平台。该平台依托于5G的处理能力与内容分发网络,拥有超高清云端制播能力,实现超高清视频的素材管理、视频制作、视频分发的全流程一站式服务,并对传统视频生产工具云端再造。通过打造5G+4K/8K+VR/AR超高清视频汇聚生产、汇聚、分发平台,咪咕视频云致力于为多行业、多场景提供音视频技术能力和行业整体解决方案应用。


2. 云游戏服务平台解决方案

马保宏


 


云游戏服务平台是基于中国移动“5G+云+边”能力,推出的集边缘节点资源开通、游戏资源分配、游戏云化、视频流编解码、游戏门户生成等功能的游戏能力平台。该平台具备全面适配、多终端支持、快速接入和5G+边缘加速等特点,提供游戏云化能力、边缘节点缘度、多种展示形态和多种游戏规格等核心功能,通过提供硬件、能力、功能为一体的云游戏服务,致力于帮助各类行业客户快速搭建云游戏平台,降低云游戏技术门槛,用户通过使用PaaS、SaaS能力,可快速搭建专属的云游戏后台及客户端,自助开展云游戏业务运营。


3.5G+VR全场景能力及解决方案

朱奇


 


云VR作为5G制高点业务之一,两者核心技术融合能带来更加优质体验。5G云VR平台围绕“平台+内容+品牌+生态”,保障优质用户体验,通过实现业务统一管理,打造全维度智慧中台,面向内容制作者和应用开发者,提供智能化生产制作能力。该平台依托咪咕超高清平台实现云VR集约平台能力,包括采集、制作、传输、业务、运营以及VR前端开发能力,保证多终端形态覆盖面向用户提供完整可运营的VR体验。通过超高清Fov、3D、近眼显示、自然交互、虚拟场景等技术向用户提供可交互的进阶沉浸式体验。


4.AR业务解决方案

朱奇




随着国家政策红利不断释放,AR已成5G新数字基建的必争之地,因此咪咕公司结合优势,依托AR内容和应用的新型体验形态,提供软硬件一体化的AR业务解决方案。AR业务解决方案平台建设规划以内容技术为核心,通过拉通产业链上下游,加快能力引入建设,构建全方位的服务体系,提供行业应用拓展能力。该平台整体架构依托5G基础设施,围绕AR基础能力、AR内容服务核心系统持续夯实“技术+内容”底座,构建通用AR产品服务和解决方案,面向CHBN领域实现行业赋能,从而满足领域客户的线上线下一体化营销能力升级和业务体验创新要求。


5.灵犀云智能语音能力及解决方案

周冰



灵犀云是中国移动集团内首个建成且大规模应用的智能语音平台,近年来,在保持灵犀云语音能力领先优势基础上,重点投入语音能力的服务化、产品化建设,提升对外开放的云服务能力。同时充分利用了咪咕内容平台优势,结合智能语音技术,打造了智能化应用解决方案,实现了从“单纯提供语音能力接口”向“提供标准语音产品的云服务 ”的逐步转变。平台能力输出方式包括基础语音能力输出、解决方案输出、和产品输出等,为移动体系及政企客户提供高效优质的智能语音服务。平台具备语音识别、语音合成、语义理解、机器翻译等11项智能语音能力及语音能力相关的前置降噪、音效处理、语音识别后处理、语义后处理、翻译自学习模型等能力。同时针对客服、会议记录、直播字幕等业务服务场景,重点打造“语音质检分析”、“电话秘书”、 “字幕平台”等产品。


6.音视频互动通信能力

饶明佺



音视频互动通信能力是由咪咕公司自主研发,以音视频互动通话为核心功能的企业通讯应用,具备低延时直播、观看、屏幕分享等能力,适用于视频会议、直播连麦、远程招聘、云K歌、在线教育、远程教练、音视频社交等业务场景。通过提供稳定、流畅的准实时云边端一体化服务能力,实现互动视频通信参与各方流畅的超高清视频(1080P)通信能力,支持常规的视频会议等场景,支持基于互动音视频通信的业务创新。


7.数智运营能力

钟宜峰



为满足精细化运营、营销等业务场景需求,提高运营效率,咪咕公司推出数智化运营,通过Amber实时运营分析能力、PUSH插件推送能力、UGC短视频插件能力、AI人像生产能力、问题反馈插件能力。通过用户从活动开始、进行中、活动结束,覆盖活动整个生命周期的运营能力,实现对用户在活动中的精准运营、推送、视频、图片互动、问题回复解决,实现用户深度参与,打造极致数智化运营,为中国移动用户提供便捷高效的精细化服务,提高客户使用粘性,业务量提升约全年10%左右。从而解决传统运营出数慢、推送量不足、用户反馈效率低等问题。


8. AI视音幻构能力

谢中流



随着短视频渗透到生活的方方面面,咪咕公司开发了以AI技术驱动为核心的视频二次创作平台“AI视音幻构”,核心能力主要分为智拍、智作、智优三个板块,分别切入视频创作的前期拍摄、中期生产和后期优化三个环节,实现了内容创作的全流程覆盖。全流程的智能化涉及到了大量AI能力的研发和应用,包括美颜、微整形、视频超分、视频插帧和视频特效等。


9. 智能插帧能力

韩笑尘


 


为提升用户观看体验,满足用户日益增长的需求,咪咕公司自研一套视频帧率提升解决方案。通过运用自研的智能插帧能力,基于AI的学习算法、基于场景的模型优化和全自研模型、容器化部署等AI技术,提升视频的帧率,使视频的动态细节、流畅度大幅提升,适合各类影视体育综艺场景的视觉展现。本次分享主要从AI技术的简介和价值、AI插帧技术的技术方案、AI插帧技术的成果以及AI插帧技术的展望四个部分分享本次主题。


10.超高清3D数字分身生成能力

罗志平


 


超高清3D数字分身生成能力是集团应用基础研究项目《基于深度学习3D建模》最新的研究成果,通过使用亚毫米级精度三维人脸扫描重建技术、3D人脸配准技术、3D妆容美颜技术、毛发系统生成技术、参数化体型调节技术、3D数字服装及柔性布料仿真、动作表情驱动管线技术、云渲染技术和超高清4K/8K渲染成像等技术,从人脸三维扫描重建到最后的渲染成像,3D数字分身生成全栈流程,从而赋能虚拟变装摄影、4K虚实集成视频等业务场景。



本次活动累计9154人次通过视频会议、中移网大同步观看和线下参与学习。


通过本次科技成果日成果分享,相信大家对音视频技术在数字内容领域的创新实践有了更多深入了解。感谢各位专家分享,感谢大家聆听学习,我们下期再见。


往期科技成果日资料

及中国移动全量成果资料

可前往“科技成果库”查阅下载


访问方式:

1.电脑使用外网访问https://a.vpn.bigcloudsys.cn/(用户名OA邮箱,密码OA密码);

2.拨通VPN后,访问研发云首页

(https://www.bigcloudsys.cn:8443/)中的科技成果库系统,点击“动态”中的“科技成果日”即可。


科技成果日活动视频回放

可前往“中移网大”观看


访问方式:

1. 电脑访问https://wangda.chinamobile.com或手机访问 “中移网大”APP;

2. 登录并搜索“科技成果日学习专题”,进入观看往期课程。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存