查看原文
其他

机器学习组实习开放岗位

微软学术合作 微软学术合作 2022-10-08

机器学习组

组别介绍:

微软亚洲研究院机器学习领域从理论、算法、应用等不同层面推动机器学习的前沿。我们的研究兴趣包含:深度学习、强化学习、图学习、梯度提升树、在线学习、预训练、动态学习、学习理论等。同时, 我们也在积极探索人工智能在自然科学和产业应用中的价值,从而为科学工作者和传统工业赋能(具体见研究概况)。在过去的十几年间,我们在顶级国际会议和期刊上发表了大量被高度引用的高质量论文,向微软的产品部门转化了大量核心技术,并帮助众多的企业合作伙伴实现了数字化转型。我们也向开源社区贡献了大量高质量开源工具,例如 LightGBM、LigthLDA、微软图引擎,多智能体资源优化平台“群策 MARO”,业内首个AI量化投资平台“微矿 Qlib”,以及最新的时空预测平台“FOST”。

机器学习+计算化学/计算物理算法实习生


点击此处向上滑动阅览

工作职责

  • 复现已有论文

  • 改进现有代码、性能优化


       工作方向(选其一)

  • 利用图神经网络等相关方法进行分子材料表征

  • 使用生成模型、强化学习等方法完成分子材料设计

  • 利用神经网络加速偏微分方程求解

  • 利用神经网络完成积分方程求解

  • 利用 cuda 语言加速

任职要求

  • 计算机、电子、化学、物理或相关专业(本科/硕士/博士)

  • 扎实的数据结构/算法基础

  • 熟悉常见的机器学习算法,熟悉使用 PyTorch 或 TensorFlow 等

  • 熟练的编程能力

  • 快速学习能力,良好的沟通与合作能力

工作时间要求

能获得导师许可并保证至少三个月的实习。

智能金融算法研发实习生


点击此处向上滑动阅览

工作职责

  • 智能金融研究方向:

    • 研究机器学习在金融领域(如量化投资)的应用

    • 打破传统投资框架,探索全新的投资策略学习范式,将研究成果发布到相关领域的顶级会议或期刊

    • 将研究工作开源到微软自研量化投资平台 Qlib (https://github.com/Microsoft/qlib) ,在开源社区和金融领域最活跃最前沿的同行进行深度交流

    • 放下 Toy data 走出象牙塔,面对真实的海量金融数据,设计面向百亿级别的实际金融场景,应对变化莫测的金融市场

  • 智能金融系统开发方向:

    • 定义下一代量化投资研发框架,了解并解决开源社区和金融领域最活跃最前沿的同行的最新需求,研发和维护量化投资平台(Qlib https://github.com/microsoft/qlib)

    • 将理想实验环境中的算法迁移到真实的金融交易场景中,针对真实市场中的问题优化模型和策略,在真实金融数据中分析和定位模型问题

    • 设计和改进运营百亿级别资金的量化投资系统,解决在真实交易环境中遇到的系统瓶颈,对架构设计和系统性能进行调优

  • 智能金融监管研究方向:

    • 研究机器学习在金融监管领域的应用,场景包括反洗钱、反欺诈等

    • 将异常检测算法用于洗钱及欺诈行为检测

    • 基于图神经网络、时空图等模型建模用户间关联,检测洗钱及欺诈团伙

    • 利用时间序列模型分析洗钱行为及欺诈行为的时序异常规律

    • 将研究成果发布到相关领域的顶级会议或期刊;将算法落地到实际场景中去,在充满噪声的数据中精准识别诡计多端的不法分子

任职要求

  • 熟悉各类机器学习算法、模型的优化,熟悉常用的机器学习工具

  • 具备优秀的编程能力和扎实的算法基础,精通 Python 和 Linux 开发环境

  • 能熟练使用至少一种深度学习框架(PyTorch、Tensorflow及Caffe 等)

智能医疗算法研究实习生


点击此处向上滑动阅览

工作职责

  • AI for Health 相关前沿论文的阅读及分享

  • 医疗数据分析、场景挖掘、问题定义

  • 独立推进一项研究子课题,在真实场景的数据中验证

  • 撰写论文及专利

任职要求

  • 计算机、电子或相关专业(本科/硕士/博士)

  • 扎实的机器学习基础知识和编程能力

  • 积极主动的研究和学习态度

  • 有time series, tabular data, graph neural network, CV, NLP 等方向研究经历者优先

  • 有完整的论文撰写及投稿经历者优先

  • 有 Kaggle、ACM 等竞赛获奖者优先

强化学习算法应用实习生


点击此处向上滑动阅览

工作职责

  • 积极跟进和关注强化学习算法的前沿研究

  • 参与机器学习算法,特别是强化学习相关算法的研究

  • 参与强化学习算法在物流、能源、工业控制等领域的落地应用

任职要求

  • 计算机或相关专业硕士或以上学历,有较强编程能力的优秀本科生也欢迎申请

  • 具备良好的数学基础,机器学习知识

  • 具有较强的编程实现能力,良好的沟通能力和团队协作精神

  • 加分项:有强化学习算法的开发和研究经历;顶级 AI 会议文章;熟练掌握深度学习框架(PyTorch, TensorFlow 等);有开源软件开发经历等

工作时间要求

能获得导师许可并保证至少三个月、每周至少四天的实习

机器学习组AI for Science实习生


点击此处向上滑动阅览

工作职责

  • 基于深度学习的分子模拟,如分子动力学,分子性质预测,分子生成,逆合成等。

  • 深度学习模型在算法及理论层面的创新,如图神经网络、大规模预训练算法等。

  • 深度学习在材料发现、药物发现等中的应用。

  • 机器学习与湿实验相结合。

  • 使用机器学习加速密度泛函理论等。

任职要求

  • 扎实的数理基础知识。

  • 任一相关方向扎实的背景知识。

  • 熟练使用PyTorch/Tensorflow等深度学习库。

       加分项:

  • 有机器学习方向顶会论文发表。或

  • 有丰富的计算物理、化学、生物知识,会熟练使用相关量子化学软件等。

  • 实习时间一年及以上。

工作时间要求

能获得导师许可并保证至少三个月、每周至少四天的实习

复杂疾病方向实习生


点击此处向上滑动阅览

工作职责

  • (生物方向)调研、整理相关疾病科学研究进展及临床治疗现状

  • (生物、计算方向)收集、分析相关疾病数据,参与核心问题定义及解决路径设计

  • (计算方向)基于已有生物数据库及相关疾病科研、临床数据,设计针对问题的有效算法

任职要求

  • 计算机、生物信息学或生物医学相关专业(硕士/博士)

  • 生物方向:

    • 较强的英文文献阅读和总结能力

    • 基本的数据结构/算法基础与编程能力(Python优先)

    • 良好的沟通、表达、合作能力

  • 计算方向:

    • 扎实的深度学习/算法基础,图算法及知识图谱项目经验优先

    • 学习并接纳新领域知识,尤其是生物医学知识的意愿

    • 良好的沟通、合作能力

工作时间要求

能获得导师许可并保证至少三个月的实习

生物序列建模实习生


点击此处向上滑动阅览

工作职责

  • 蛋白质序列数据的序列分析与建模,包括但不限于蛋白质序列分析、蛋白质语言模型的设计与实现、基于蛋白质序列语言模型的预训练、蛋白质预训练模型的下游任务及应用等。

任职要求

  • 扎实的数据结构/算法基础,熟练掌握概率论与数理统计

  • 熟练的编程能力,能够熟练运用Python

  • 快速学习能力,有良好数据敏感度

  • 良好的沟通与合作能力,能用英语交流

  • 对数据分析有较深的认识, 有大规模数据处理的项目经验

  • 具备较强的数学建模能力,熟悉常见的机器学习模型,有模型的调参经验

  • 熟悉PyTorch者优先;熟悉序列数据分析,对生物序列数据感兴趣者优先;有发表顶会或顶刊文章经验者优先

工作时间要求

能获得导师许可并保证至少三个月的实习。

基因组学/转录组学实习生


点击此处向上滑动阅览

工作职责

  • 调研并整理3D基因组学/空间转录组学/表观遗传组学等相关领域前沿进展与研究问题

  • 收集并整理3D基因组学/空间转录组学/表观遗传组学研究的相关数据

  • 参与设计并实施相关领域计算生物学科研项目

任职要求

  • 生物信息学、计算生物学、分子生物学、遗传学或相关专业(硕士/博士)

  • 基本的数据结构/算法基础与编程能力(Python优先)

  • 较强的英文文献阅读和总结能力

  • 自主科研能力与表达、沟通能力

工作时间要求

能获得导师许可并保证至少三个月的实习。

生物分子建模实习生


点击此处向上滑动阅览

工作职责

  • 蛋白质结构预测以及三维结构分子建模

  • RNA分子结构预测以及三维结构分子建模

  • 小分子三维构象建模生成以及性质预测

任职要求

  • 计算机、生物信息学、计算生物学或相关专业(本科/硕士/博士)

  • 扎实的数据结构/算法基础,熟悉PyTorch者优先

  • 具有机器学习项目经验 或 熟练的编程能力 或 较强的数据分析能力

  • 了解生物大分子以及小分子3D分子建模或者有相关项目经验者优先

工作时间要求

能获得导师许可并保证至少三个月的实习。

强化学习算法研究实习生

工作职责

  1. 参与强化学习算法在game testing,logistics,congestion control等领域的落地。在这里,你有机会接触工业级的数据,接触并研发实际业务中的核心技术,并且让强化学习在实际问题中发挥巨大的影响力。

  2. 从上述应用中抽象研究问题,进行算法研究。在这里,你有机会接受科研方面的指导和训练,接触研究院提供的各种学术交流机会,在顶级国际会议和期刊上发表高质量的研究工作。

任职要求

  1. 计算机或相关专业博士,有志于科研的本科生或硕士也欢迎申请;

  2. 具有较强的编程实现能力,良好的沟通能力和团队协作精神;

  3. 具备一定的强化学习基础,能够读懂顶级国际会议强化学习方面的论文;

  4. 加分项:有数学/物理/信息学竞赛方面的成绩;有强化学习算法的开发和研究经历;在顶级国际会议和期刊上发表过强化学习方面的工作。

工作时间要求

能获得导师许可并保证至少三个月的实习。

强化学习实习生


点击此处向上滑动阅览

工作职责

  • 进行机器学习领域前沿研究,在顶级会议和期刊上发表文章,推动AI技术在工业界的落地

    • Game AI:通过游戏抽象现实问题。

    • Probabilistic RL:进行强化学习基础算法研究,致力于推动强化学习算法发展

    • 算法落地:强化学习应用研究

任职要求

  • 熟悉Linux、Python,精通 Pytorch 或Tensorflow

  • 精通至少一个机器学习子领域的前沿工作,对该领域有自己的理解

  • 知晓RL|VAE|GameAI & DL领域的前沿工作和重要工作,拥有论文快速检索和阅读能力

  • 擅长对实际问题建模,具备优秀的研究直觉

  • 具备优秀的实验管理能力

  • 能保证至少六个月的实习, 每周不少于四天

    加分项:

  • ICML/NIPS/ICLR/CVPR/ICCV/ECCV/ACL/KDD 发表论文经历

  • ACM 或其他编程比赛经历

  • 数据科学竞赛经历

工作时间要求

能获得导师许可并保证至少6个月的全职实习。

语音研究实习生


点击此处向上滑动阅览

工作职责

  • 参与机器学习、自然语言处理、语音相关算法研究,参与文本到语音合成相关算法研究

  • 参与研究选题、算法模型设计、实验验证、论文写作以及实践应用、产品落地等相关流程

任职要求

  • 计算机、电子或相关专业(本科/硕士/博士)

  • 具有良好的逻辑思维能力,扎实的数理、编程基础,熟练掌握至少一种深度学习框架,比如 Tensorflow

  • 具有良好的机器学习、深度学习基础,有扎实的深度学习模型开发、调试、优化经验者优先

  • 加分项:具有语音相关基础知识,了解传统的语音合成以及基于神经网络的端到端语音合成方法;关注语音领域最新研究进展,有相关论文发表者优先

工作时间要求

能获得导师许可并保证至少六个月的实习

研究实习生


点击此处向上滑动阅览

工作职责

  • 参与强化学习的算法研究

  • 参与机器学习/强化学习算法的实践应用

  • 参与开源项目(DMTK, LightGBM)的开发和应用

  • 面对大规模数据下机器学习/强化学习的挑战,提高现有算法的效率和准确度

任职要求

  • 计算机或相关专业

  • 具备良好的数学基础,机器学习知识

  • 具有较强的编程实现能力,良好的沟通能力和团队协作精神

  • 加分项:了解深度学习框架(PyTorch, TensorFlow 等),有 linux 下开发经验, 有使用 Git/VSO 等团队合软件,有开源软件开发经历

工作时间要求

能保证三个月的实习, 每周不少于四天

计算免疫学实习生


点击此处向上滑动阅览

工作职责

  • 基于高通量免疫组学数据,构建免疫分子间识别模型

  • 结合免疫组学和多组学数据,设计相关抗原的免疫原性预测方法

  • 免疫组学数据收集与分析

任职要求

  • 计算机、生物信息学或生物医学相关专业(本科/硕士/博士)

  • 具有机器学习项目经验 或 熟练的编程能力 或 较强的数据分析能力 或 扎实的生物医学专业基

工作时间要求

能保证三个月的实习


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存