机器学习组实习开放岗位
机器学习组
组别介绍:
微软亚洲研究院机器学习领域从理论、算法、应用等不同层面推动机器学习的前沿。我们的研究兴趣包含:深度学习、强化学习、图学习、梯度提升树、在线学习、预训练、动态学习、学习理论等。同时, 我们也在积极探索人工智能在自然科学和产业应用中的价值,从而为科学工作者和传统工业赋能(具体见研究概况)。在过去的十几年间,我们在顶级国际会议和期刊上发表了大量被高度引用的高质量论文,向微软的产品部门转化了大量核心技术,并帮助众多的企业合作伙伴实现了数字化转型。我们也向开源社区贡献了大量高质量开源工具,例如 LightGBM、LigthLDA、微软图引擎,多智能体资源优化平台“群策 MARO”,业内首个AI量化投资平台“微矿 Qlib”,以及最新的时空预测平台“FOST”。
机器学习+计算化学/计算物理算法实习生
点击此处向上滑动阅览
工作职责
复现已有论文
改进现有代码、性能优化
工作方向(选其一)
利用图神经网络等相关方法进行分子材料表征
使用生成模型、强化学习等方法完成分子材料设计
利用神经网络加速偏微分方程求解
利用神经网络完成积分方程求解
利用 cuda 语言加速
任职要求
计算机、电子、化学、物理或相关专业(本科/硕士/博士)
扎实的数据结构/算法基础
熟悉常见的机器学习算法,熟悉使用 PyTorch 或 TensorFlow 等
熟练的编程能力
快速学习能力,良好的沟通与合作能力
工作时间要求
能获得导师许可并保证至少三个月的实习。
智能金融算法研发实习生
点击此处向上滑动阅览
工作职责
智能金融研究方向:
研究机器学习在金融领域(如量化投资)的应用
打破传统投资框架,探索全新的投资策略学习范式,将研究成果发布到相关领域的顶级会议或期刊
将研究工作开源到微软自研量化投资平台 Qlib (https://github.com/Microsoft/qlib) ,在开源社区和金融领域最活跃最前沿的同行进行深度交流
放下 Toy data 走出象牙塔,面对真实的海量金融数据,设计面向百亿级别的实际金融场景,应对变化莫测的金融市场
智能金融系统开发方向:
定义下一代量化投资研发框架,了解并解决开源社区和金融领域最活跃最前沿的同行的最新需求,研发和维护量化投资平台(Qlib https://github.com/microsoft/qlib)
将理想实验环境中的算法迁移到真实的金融交易场景中,针对真实市场中的问题优化模型和策略,在真实金融数据中分析和定位模型问题
设计和改进运营百亿级别资金的量化投资系统,解决在真实交易环境中遇到的系统瓶颈,对架构设计和系统性能进行调优
智能金融监管研究方向:
研究机器学习在金融监管领域的应用,场景包括反洗钱、反欺诈等
将异常检测算法用于洗钱及欺诈行为检测
基于图神经网络、时空图等模型建模用户间关联,检测洗钱及欺诈团伙
利用时间序列模型分析洗钱行为及欺诈行为的时序异常规律
将研究成果发布到相关领域的顶级会议或期刊;将算法落地到实际场景中去,在充满噪声的数据中精准识别诡计多端的不法分子
任职要求
熟悉各类机器学习算法、模型的优化,熟悉常用的机器学习工具
具备优秀的编程能力和扎实的算法基础,精通 Python 和 Linux 开发环境
能熟练使用至少一种深度学习框架(PyTorch、Tensorflow及Caffe 等)
智能医疗算法研究实习生
点击此处向上滑动阅览
工作职责
AI for Health 相关前沿论文的阅读及分享
医疗数据分析、场景挖掘、问题定义
独立推进一项研究子课题,在真实场景的数据中验证
撰写论文及专利
任职要求
计算机、电子或相关专业(本科/硕士/博士)
扎实的机器学习基础知识和编程能力
积极主动的研究和学习态度
有time series, tabular data, graph neural network, CV, NLP 等方向研究经历者优先
有完整的论文撰写及投稿经历者优先
有 Kaggle、ACM 等竞赛获奖者优先
强化学习算法应用实习生
点击此处向上滑动阅览
工作职责
积极跟进和关注强化学习算法的前沿研究
参与机器学习算法,特别是强化学习相关算法的研究
参与强化学习算法在物流、能源、工业控制等领域的落地应用
任职要求
计算机或相关专业硕士或以上学历,有较强编程能力的优秀本科生也欢迎申请
具备良好的数学基础,机器学习知识
具有较强的编程实现能力,良好的沟通能力和团队协作精神
加分项:有强化学习算法的开发和研究经历;顶级 AI 会议文章;熟练掌握深度学习框架(PyTorch, TensorFlow 等);有开源软件开发经历等
工作时间要求
能获得导师许可并保证至少三个月、每周至少四天的实习
机器学习组AI for Science实习生
点击此处向上滑动阅览
工作职责
基于深度学习的分子模拟,如分子动力学,分子性质预测,分子生成,逆合成等。
深度学习模型在算法及理论层面的创新,如图神经网络、大规模预训练算法等。
深度学习在材料发现、药物发现等中的应用。
机器学习与湿实验相结合。
使用机器学习加速密度泛函理论等。
任职要求
扎实的数理基础知识。
任一相关方向扎实的背景知识。
熟练使用PyTorch/Tensorflow等深度学习库。
加分项:
有机器学习方向顶会论文发表。或
有丰富的计算物理、化学、生物知识,会熟练使用相关量子化学软件等。
实习时间一年及以上。
工作时间要求
能获得导师许可并保证至少三个月、每周至少四天的实习
复杂疾病方向实习生
点击此处向上滑动阅览
工作职责
(生物方向)调研、整理相关疾病科学研究进展及临床治疗现状
(生物、计算方向)收集、分析相关疾病数据,参与核心问题定义及解决路径设计
(计算方向)基于已有生物数据库及相关疾病科研、临床数据,设计针对问题的有效算法
任职要求
计算机、生物信息学或生物医学相关专业(硕士/博士)
生物方向:
较强的英文文献阅读和总结能力
基本的数据结构/算法基础与编程能力(Python优先)
良好的沟通、表达、合作能力
计算方向:
扎实的深度学习/算法基础,图算法及知识图谱项目经验优先
学习并接纳新领域知识,尤其是生物医学知识的意愿
良好的沟通、合作能力
工作时间要求
能获得导师许可并保证至少三个月的实习
生物序列建模实习生
点击此处向上滑动阅览
工作职责
蛋白质序列数据的序列分析与建模,包括但不限于蛋白质序列分析、蛋白质语言模型的设计与实现、基于蛋白质序列语言模型的预训练、蛋白质预训练模型的下游任务及应用等。
任职要求
扎实的数据结构/算法基础,熟练掌握概率论与数理统计
熟练的编程能力,能够熟练运用Python
快速学习能力,有良好数据敏感度
良好的沟通与合作能力,能用英语交流
对数据分析有较深的认识, 有大规模数据处理的项目经验
具备较强的数学建模能力,熟悉常见的机器学习模型,有模型的调参经验
熟悉PyTorch者优先;熟悉序列数据分析,对生物序列数据感兴趣者优先;有发表顶会或顶刊文章经验者优先
工作时间要求
能获得导师许可并保证至少三个月的实习。
基因组学/转录组学实习生
点击此处向上滑动阅览
工作职责
调研并整理3D基因组学/空间转录组学/表观遗传组学等相关领域前沿进展与研究问题
收集并整理3D基因组学/空间转录组学/表观遗传组学研究的相关数据
参与设计并实施相关领域计算生物学科研项目
任职要求
生物信息学、计算生物学、分子生物学、遗传学或相关专业(硕士/博士)
基本的数据结构/算法基础与编程能力(Python优先)
较强的英文文献阅读和总结能力
自主科研能力与表达、沟通能力
工作时间要求
能获得导师许可并保证至少三个月的实习。
生物分子建模实习生
点击此处向上滑动阅览
工作职责
蛋白质结构预测以及三维结构分子建模
RNA分子结构预测以及三维结构分子建模
小分子三维构象建模生成以及性质预测
任职要求
计算机、生物信息学、计算生物学或相关专业(本科/硕士/博士)
扎实的数据结构/算法基础,熟悉PyTorch者优先
具有机器学习项目经验 或 熟练的编程能力 或 较强的数据分析能力
了解生物大分子以及小分子3D分子建模或者有相关项目经验者优先
工作时间要求
能获得导师许可并保证至少三个月的实习。
强化学习算法研究实习生
工作职责
参与强化学习算法在game testing,logistics,congestion control等领域的落地。在这里,你有机会接触工业级的数据,接触并研发实际业务中的核心技术,并且让强化学习在实际问题中发挥巨大的影响力。
从上述应用中抽象研究问题,进行算法研究。在这里,你有机会接受科研方面的指导和训练,接触研究院提供的各种学术交流机会,在顶级国际会议和期刊上发表高质量的研究工作。
任职要求
计算机或相关专业博士,有志于科研的本科生或硕士也欢迎申请;
具有较强的编程实现能力,良好的沟通能力和团队协作精神;
具备一定的强化学习基础,能够读懂顶级国际会议强化学习方面的论文;
加分项:有数学/物理/信息学竞赛方面的成绩;有强化学习算法的开发和研究经历;在顶级国际会议和期刊上发表过强化学习方面的工作。
工作时间要求
能获得导师许可并保证至少三个月的实习。
强化学习实习生
点击此处向上滑动阅览
工作职责
进行机器学习领域前沿研究,在顶级会议和期刊上发表文章,推动AI技术在工业界的落地
Game AI:通过游戏抽象现实问题。
Probabilistic RL:进行强化学习基础算法研究,致力于推动强化学习算法发展
算法落地:强化学习应用研究
任职要求
熟悉Linux、Python,精通 Pytorch 或Tensorflow
精通至少一个机器学习子领域的前沿工作,对该领域有自己的理解
知晓RL|VAE|GameAI & DL领域的前沿工作和重要工作,拥有论文快速检索和阅读能力
擅长对实际问题建模,具备优秀的研究直觉
具备优秀的实验管理能力
能保证至少六个月的实习, 每周不少于四天
加分项:
ICML/NIPS/ICLR/CVPR/ICCV/ECCV/ACL/KDD 发表论文经历
ACM 或其他编程比赛经历
数据科学竞赛经历
工作时间要求
能获得导师许可并保证至少6个月的全职实习。
语音研究实习生
点击此处向上滑动阅览
工作职责
参与机器学习、自然语言处理、语音相关算法研究,参与文本到语音合成相关算法研究
参与研究选题、算法模型设计、实验验证、论文写作以及实践应用、产品落地等相关流程
任职要求
计算机、电子或相关专业(本科/硕士/博士)
具有良好的逻辑思维能力,扎实的数理、编程基础,熟练掌握至少一种深度学习框架,比如 Tensorflow
具有良好的机器学习、深度学习基础,有扎实的深度学习模型开发、调试、优化经验者优先
加分项:具有语音相关基础知识,了解传统的语音合成以及基于神经网络的端到端语音合成方法;关注语音领域最新研究进展,有相关论文发表者优先
工作时间要求
能获得导师许可并保证至少六个月的实习
研究实习生
点击此处向上滑动阅览
工作职责
参与强化学习的算法研究
参与机器学习/强化学习算法的实践应用
参与开源项目(DMTK, LightGBM)的开发和应用
面对大规模数据下机器学习/强化学习的挑战,提高现有算法的效率和准确度
任职要求
计算机或相关专业
具备良好的数学基础,机器学习知识
具有较强的编程实现能力,良好的沟通能力和团队协作精神
加分项:了解深度学习框架(PyTorch, TensorFlow 等),有 linux 下开发经验, 有使用 Git/VSO 等团队合软件,有开源软件开发经历
工作时间要求
能保证三个月的实习, 每周不少于四天
计算免疫学实习生
点击此处向上滑动阅览
工作职责
基于高通量免疫组学数据,构建免疫分子间识别模型
结合免疫组学和多组学数据,设计相关抗原的免疫原性预测方法
免疫组学数据收集与分析
任职要求
计算机、生物信息学或生物医学相关专业(本科/硕士/博士)
具有机器学习项目经验 或 熟练的编程能力 或 较强的数据分析能力 或 扎实的生物医学专业基
工作时间要求
能保证三个月的实习