多媒体计算组实习开放岗位
多媒体计算组
组别介绍:
微软亚洲研究院多媒体计算组致力于多媒体实时通信中的各种技术,囊括底层的视频音频处理、压缩、编解码和上层的计算机视觉和语音处理与理解。利用人工智能等技术提高多媒体实时通信中的用户体验。在微软亚洲研究院有超过 20 年的研究与工程技术积累,技术转换到包括 Office, Microsoft Teams, Surface 和 XBox 等多条产品线。另外,研究员们在这些相关领域的顶会上发表过多篇论文,包括CVPR, SIGGRAPH, ICCV, NIPS, AAAI, TPAMI, ACMMM等。加入多媒体计算组,研究最前沿的计算机视觉技术,培养目标为论文、竞赛以及算法,并落地于微软产品。
研究实习生(1)
点击此处向上滑动阅览
工作职责
在研究员的指导下,针对音频和语音方向开展前沿性研究、实验验证以及论文撰写,包括
实时音视频通信中的音频信号处理,比如语音去噪,回声消除,丢包补偿,编码以及抖动控制等。
音频和语音表征学习 (Audio and speech representation learning) 。
音频和语音任务的网络泛化能力和适应性研究 (Domain generalization and domain adaptation)。
任职要求
计算机、电子或相关专业(本科/硕士/博士),研究方向为以下之一:计算机视觉/通信/语音信号处理/人工智能
扎实的编程能力(Python / C++),熟悉至少一种常用的深度学习框架 (Tensorflow / PyTorch)
快速学习能力, 良好的沟通与合作能力
具备阅读及撰写英文文献的能力
加分项:有相关研究经历/有论文发表/有参加相关比赛经验者优先
工作时间要求
能获得导师许可并保证至少六个月的实习。
研究实习生(2)
点击此处向上滑动阅览
工作职责
每位实习生都会在一位或多位研究员的指导下在图像和视频压缩以及处理方面进行最前沿的研究工作。你将参与到一些最新的图像及视频压缩,去噪,增强等项目中。该招聘职位旨在研究图像和视频压缩处理中特征表达,提取和传播的问题,通过更为普适的特征,进而达到提升压缩率和提高处理效果的目的。
任职要求
计算机科学、软件工程、电子工程或其它相关专业的硕士研究生或博士研究生
具备深度学习,计算机视觉,视频压缩和处理相关知识
具有优秀的编程能力或相关的项目经验
具有良好的沟通能力和团队协作精神
能得到导师的书面同意
工作时间要求
能获得导师许可并保证至少六个月的实习。
计算机视觉研究实习生
点击此处向上滑动阅览
工作职责
在研究员的指导下,针对以下列出的研究方向之一开展前沿性研究、实验验证以及论文撰写:
视频表达学习(Video Representation Learning), 视频对象分割(Video Object Segmentation)/ 视频实例分割(Video Instance Segmentation)。
基于视频的深度估计 / 光流估计 (Depth estimation and Optical flow estimation)
神经渲染 / 神经辐射场 (Neural Rendering / Neural Radiance Fields), 基于深度学习的三维重建 (Learning-based 3D Reconstruction)
任职要求
计算机、电子或相关专业(本科/硕士/博士),研究方向为以下之一:计算机视觉/计算机图形学/人工智能
扎实的编程能力(Python / C++),熟悉至少一种常用的深度学习框架 (Tensorflow / PyTorch)
快速学习能力, 良好的沟通与合作能力
具备阅读及撰写英文文献的能力
加分项:有相关研究经历/有论文发表/有参加相关比赛经验者优先
工作时间要求
能获得导师许可并保证至少六个月的实习。