查看原文
其他

探险 AI 大模型最前沿|OpenBMB 招募实习生,待遇不设上限

OpenBMB开源社区 OpenBMB开源社区 2024-03-19

随着 ChatGPT 和 GPT-4 的持续火爆,大模型技术不断升温,不少AI 志士希望投身这一领域的研发。OpenBMB 早在 2022 年 7 月就推出了面向高校博士生、硕士生和优秀本科生的 “破壁英才” 实习生项目。项目由 面壁智能 清华大学自然语言处理实验室 共同发起,旨在培养大模型相关的高水平研究与工程人才。

在项目中,我们为实习生提供 良好的工作氛围、丰富的交流机会、舒适的办公环境、丰厚的工作待遇,并希望每一位实习生都能够学有所用、不断进步,与我们一同突破阻碍国产大模型技术创新的层层壁垒,勇攀科学与技术的高峰。项目发起以来,我们陆续接收了来自国内外 10 多所高校的实习生,他们有的仍然留在这里深耕大模型领域,有的继续去高校深造相关学业,但都坦言这是一次极具意义的经历。

目前,“破壁英才”实习生项目仍在火热进行中,我们诚邀更多英才加入!本次招募新增人工智能对话模型、多模态算法和工具学习算法岗位。实习薪资上不封顶,根据具体能力商定。下面,我们将从团队介绍、收获预期、职位介绍、上岗要求、投递方式、实习生感想 六个方面介绍项目。


01 关于我们


OpenBMB 全称为 Open Lab for Big Model Base,宗旨为 “让大模型飞入千家万户”。团队目前主要由清华大学自然语言处理实验室成员组成,致力于 大模型核心技术研发与创新应用构建,推动大模型技术标准化,降低大模型使用门槛,构建智能时代大模型基础设施。我们的团队特色:

 🎉   开源信仰坚定 

  • 团队具有丰富的自然语言处理技术的开源经验,团队成员前期曾参与发布了 OpenKE、OpenNRE、OpenNE 等一系列有世界影响力的工具包,在 GitHub 上累计获得 超过5.8万星标,位列 全球机构第142位

  • OpenBMB 开源社区参与发起的所有项目在 GitHub 收获了 4k+星标,为国内开发者提供了良好服务体验,吸引了一大批感兴趣的开发者参与其中,目前有超过2000名 开发者加入 OpenBMB 开源社区微信群


 🎓   研发实力雄厚 

  • 创始团队来自于清华大学计算机系自然语言处理与社会人文计算实验室,由知名清华大学教授担任技术顾问,成员包括 国家奖学金获奖者、全国信息学竞赛金牌得主 

  • 核心团队成员均具有知名大学博士和硕士学历,在国际国内权威期刊发表论文百余篇,获得十余项专利授权,科研和技术实力处于国内领先水平

  • 曾开源发布多个有学术与业界影响力的大模型,其中包括 国内首个 中文大模型 CPM-1、高效易用大模型 CPM-2、可控持续大模型 CPM-3、国内首个 法律领域大模型 Lawformer、生物医学领域大模型 KV-PLM(论文入选Nature Communications Spotlight)等

 📈   业务场景丰富 

  • 面壁智能公司已经完成 数千万元天使轮融资,并与国内知名机构与公司达成战略合作

  • 目前面壁智能已达成 数百万元 订单并得到客户广泛认可,具有丰富的业务场景


 🙋‍♂️   倡导交流分享 

  • 团队在智源社区、B站等平台开展 相关技术交流与分享十余场

  • 团队推出国内首门大模型课程,在各大平台持续积累关注度,全网播放量 60w+ 次


02 你将获得


 💎   难得的机会 

在这里,你将获得下列宝贵与难得的机会:

  • 零距离参与当前 AI领域最火热研究课题——大规模预训练模型的研究与应用

  • 了解与参与一家AI创业公司 从0到1 的发展历程

 🙋   丰富的交流 

我们将为热爱计算机、热爱大模型的同学们提供丰富的交流活动:

  • 我们会每月组织领域 大牛学术分享会,为每一位同学提供和领域大牛面对面交流机会,共同探索最前沿的工作

  • 我们还会安排实习生与 科学家导师一对一交流,就关于如何做好科研、如何选定方向、未来职业规划等问题进行探讨

 💰   丰厚的报酬 

我们将为每一位加入面壁智能的同学提供 具有竞争力的报酬

  • 工作上,我们为大家准备了 MacBook Pro、4K显示器

  • 生活上,我们将为实习生提供具有市场竞争力的 薪资与餐补,不间断供应丰富的 零食、水果与下午茶


 💡   光明的未来 

我们希望每一位实习的同学都能找到适合自己的发展道路:

  • 实习结束后,我们将为每一位同学提供由面壁智能和 THUNLP 联合认证实习证明,表现优异的同学更有机会拿到科学家导师的 推荐信

  • 同时,我们也将为表现优异的同学提供 全职留用 的机会


03 职位介绍


 💻   技术类岗位 
  人工智能对话模型实习生

工作内容

  • 参与人工智能对话模型的研发与优化,如对话数据处理、模型架构设计、训练及调优等;

  • 收集和整理数据,参与对话模型的评估和测试;

  • 基于对话基座模型进行进阶应用和功能的开发。

任职要求

  • 熟悉Python编程语言和PyTorch深度学习框架;

  • 对预训练语言模型的微调有相关经验,了解NLP的前沿进展;

  • 有良好的沟通能力,工作积极主动,对大模型的应用感兴趣,能够与团队其他成员协作。


  多模态算法实习生

工作内容

  • 参与大规模多模态预训练模型的研发和微调,包括文生图模型、图生文模型;

  • 根据具体任务的需求,查阅相关资料和文献,并结合实际情况实现相应技术。

任职要求

  • 多模态学习、机器学习及相关专业1年以上相关工作经验;

  • 较强的算法开发能力,熟练使用Python编程语言和Pytorch 深度学习框架;

  • 对计算机视觉、预训练、文生图模型有一定深度的理解和经验,能根据论文复现相关算法,有大规模预训练模型研发和训练经验者优先;

  • 在CVPR, ICCV, ECCV, ACL, EMNLP等相关领域会议发表过论文者优先。


  工具学习算法实习生

工作内容

  • 参与大模型调用现有工具/API的算法研究与系统优化,例如模型架构设计、训练调优等;

  • 收集和整理数据,研究工具使用数据的自动标注;

  • 参与工具学习标注/应用平台的构建。

任职要求

  • 熟悉Python编程语言和PyTorch深度学习框架;

  • 对预训练语言模型的微调有相关经验,了解NLP的前沿进展;

  • 有自主想法,具备良好的沟通能力。


  NLP系统实习生

工作内容

  • 开发大规模预训练语言模型训练、部署、微调系统,主要涉及功能实现、性能优化、系统调优、硬件适配等工作;

  • 在工作的过程中,需要根据具体任务的需求,查阅相关资料和文献,并结合实际情况实现相应技术。

任职要求

  • 熟练掌握 C语言和 Python;

  • 熟悉 CUDA 计算架构,拥有 CUDA 相关编程经验;

  • 了解 NLP领域重要任务、主流模型结构;

  • 熟练使用 Pytorch 深度学习框架;

  • 能够熟练阅读外文文献、文档和相关社区论坛内容,可以针对自己的需要检索并学习相关知识;

  • 有良好的沟通能力,工作积极主动,对大模型的应用感兴趣,能够与团队其他成员协作。

  NLP应用实习生

工作内容

  • 参与算法落地及对接工作,利用已有系统实现大规模语言模型在具体任务上的应用,并与相关开发人员完成相应的功能对接和调整工作;

  • 在工作的过程中,能够根据自己对算法的理解,主动探索或提出新的应用场景,并进行原型的实现;

  • 参与 文生图、智能对话 等创新应用的研究与开发。

任职要求

  • 熟练掌握 C语言和 Python;

  • 有 NLP领域相关开发或科研经验,了解 NLP领域重要任务和主流模型,对预训练语言模型有深入了解;

  • 能够根据自己的想法,自主检索相关文献,并设计合理技术路线;

  • 有良好的沟通能力,工作积极主动,对大模型的应用感兴趣,能够与团队其他成员协作。


  NLP数据实习生

工作内容

  • 根据研发人员的需求,收集、处理大规模文本数据,并构建相应数据集,用于支撑大模型的训练与应用;

  • 在工作过程中,能够主动挖掘数据价值,并能对数据进行一些基础特征的分析;

  • 对接标注平台与公司,负责数据标注的质量管理与监督。

任职要求

  • 熟练掌握 C语言和 Python;

  • 能够完成常见的数据处理工作,例如:去重、去噪、HTML解析等;

  • 对 NLP 领域有所了解,包括常用工具、常见算法等;

  • 有良好的沟通能力,工作积极主动,对大模型的应用感兴趣,能够与团队其他成员协作。


▶  JAVA后端实习生‍‍

工作内容

  • 参与项目设计及功能开发;

  • 参与制定、调整、完善现有项目开发及新功能的需求分析。

任职要求

  • 计算机或相关专业在校生;

  • Java 基础扎实,包括 JVM、IO、多线程、并发、网络,理解面向对象、设计原则、封装抽象等;

  • 熟悉常用的 Java 技术框架,如 spring;

  • 熟悉分布式系统的设计和应用,熟悉数据库、缓存、消息队列、RPC 等内部机制者优先。

▶  Web前端实习生

工作内容

  • 参与前端项目的功能设计、技术开发、调试和维护;

  • 参与跨部门的需求沟通、数据交互联调与接口讨论设计,独立完成开发任务。

任职要求

  • 计算机或相关专业在校生;

  • 有良好的编码习惯 ,熟悉W3C规范,熟悉 HTML5/CSS/JavaScript/ES6+/Typescript 等前端基本技能;

  • 了解Vue框架,并有实际使用经验者优先。

 🔭   非技术类岗位 

▶  产品实习生

工作内容

  • 参与技术转化为落地产品的全流程,包括需求调研、竞品分析、产品设计、项目管理等工作内容。

任职要求

  • 对AI与NLP技术有兴趣,技术相关背景优先;

  • 有相关产品从0到1开发经验者优先。


▶  战略实习生

工作内容

  • 参与公司战略制定、融资、产品推进与营销的各环节,完成相关调研与分析报告。

任职要求

  • 对于创业与公司运营感兴趣,具有经济学、金融等学科背景优先;

  • 具有风投、基金、咨询公司经验者优先。


04 上岗要求

 📍   实习地点 

北京市海淀区清华科技园威盛大厦

 🖋   实习要求  

  • 为了保证工作的连续性以及能够产出足够写入简历的成果,我们希望你能有 至少 3个月的实习期,每周至少实习 4天





05 简历投递


都看到这了,不如抓紧投递一份简历吧!有任何疑问欢迎联系我们的HR(微信号:VV25758)


🔗简历投递链接:

https://modelbest.feishu.cn/docx/T7BXdSscjowmh7xcvN5cVTCTnFc#KOIAdIWGMoSGEIxIXQXc5Eljn3b


👆你也可以扫描上方二维码投递


 🔖   一些额外的Tips 

  • 每一份简历我们都会认真对待,如果您不符合我们的要求,我们认为这仅仅是您的能力目前暂时不匹配我们的岗位需求,我们会给出具体的拒绝理由以及我们认为可行的个人发展建议,我们也非常欢迎能够大家能够隔一段时间再次投递

  • 想要参与但担心缺乏相关的专业知识?没关系,只要你 展现出强烈的兴趣与快速学习能力,我们会为你提供相应的机会

  • 没有合适的岗位?不妨先投递简历!我们完全支持 针对你的专长设定合适的岗位职责





06 实习生感想‍‍


 🧑  白同学—清华大学深圳国际研究生院研究生 

在之前同学的介绍下,我有幸来到 ModelBest 团队,并开始参与到大模型预训练的任务中去。任务初期,由于对上手流程的不熟悉,经常请教团队里的各位学长与同学,而大家也会非常热心地指导我在工作中遇到的各个问题,帮助我快速融入到团队中。在实习的四个月中,从刚开始确定模型训练目标,搭建模型框架,数据处理,到后期的模型训练与测试,每一步的工作都需要及时核验效果、分析结果。虽然之前在大模型训练领域的经验较少,但在 每个环节都有团队成员严谨的指导与核验,而且团队中也积累了相当的技术基础如 BMTrain 和 Model Center 等,我可以在快速熟悉团队工作的基础上,扩展自己的任务。在这个过程中我收获到的不仅是科研经验,更多的是一种 认真务实的科研精神。在任务后期,针对模型训练中出现的各种结果与问题,团队成员都会共同分析原因,进行下一步工作的规划,在这个过程中也能够学习到最新的前沿工作,并思考与自身工作可以进行结合的地方,对自己的工程能力与科研能力都有很大的帮助与提升。

非常感谢团队中的学长与同学对我的帮助,让我能够在这一份收获满满的实习经历中 得到快速的成长,也希望之后自己可以继续扩展自己的知识广度与深度,在这个领域持续做出贡献。


 🧑  黄同学—北京航空航天大学研究生 

在机缘巧合之下,我有幸加入到 ModelBest 这个优秀的团队中来,并与各位优秀的老师、学长、同事共同开展大模型相关的工作。在这里,我能感受到大家作为 顶级科研团队的责任与担当,也能体会到对工作中 每个环节的细致与严谨,获益良多。大模型的工作是一项复杂的大工程,数据准备、模型训练、模型推理等各方面环环相扣,微小的错误也可能导致任务的失败。但是在以上方面团队中早已有了对应的技术积累(包括但不限于 BMTrain、BMInf 等开源工具包),显著提高了各项工作的效率。再加上学长们及时的答疑解惑,让这项工程能够稳步推进。感谢刘导与团队大家的指导,期待后续能在大模型领域内收获更多的成果。


 🧑  张同学—清华大学本科生 

通过实验室老师的介绍成为了 ModelBest 的实习生。这是我的第一份实习工作,刚开始的时候每天都在问各种问题,好在各位前辈们都非常耐心地做出了解答,我也很快地融入了团队。实习的三个月中,我从学长给我提供的上手任务(一个服务器用户访问的记录系统)开始熟悉了前后端的框架,然后开始负责 Delta Center 的开发,主要完成了网站的原型设计,实现了 delta 对象的云端储存以及信息展示并且在前端提供了定制的 markdown 渲染功能。

ModelBest 是一个 非常年轻开放的团队,每一位成员都有机会在自己擅长的领域上主导一些工作,这对于个人的成长是非常有益的。内部的学习氛围也非常浓厚,我大约有 1/3 的时间用在学习前后端的相关知识,从一个菜鸟逐渐成长为可以独当一面的工程师。最后也非常感谢刘老师对我的支持和帮助,让我获得宝贵的实习机会,并且还为我提供了推荐信,使我顺利拿到了 UCSD 的深造 Offer。


 🧑  张同学—北京邮电大学研究生 

非常幸运加入到面壁智能这样一个优秀、年轻、充满活力的团队。遇到技术问题可以和大家一块讨论,有新的收获大家组会可以一起分享,除了严谨的学术外,关于人生的规划也可以找到老师和同事进行探讨。在过去实习的将近 6个月的时间里,让我印象最深刻的是看到大家对于自然语言处理相关技术的热爱,以及基于这种热爱而衍生的想让更多人了解大模型或者让相关技术服务于更多群体的目标。

正是基于这样的初衷,团队开发了 BMTrain、BMInf、BMCenter 等相关套件,让服务离用户更近、让技术的部署不再局限于昂贵的硬件、让更多的开发者凝聚到一起来推动大模型的进步。在这里做的第一个任务是基于 CPM3 的文本压缩,经常会遇到生成文本长度不满足要求,或者长度满足但是文本关键信息丢失等情况,针对每种情况通过与同事不断的探讨去改进到解决。到后面独立负责文本修正和广告处理等任务,因为有很多优秀的同事一起去探讨和指导,所以在这个过程中积累丰富的训练模型的经验,对数据有了更深刻的理解,对大模型的能力有了新的认识。

大模型能做的事情有很多,需要去为大模型做的事也有很多,很幸运加入到面壁智能这样做大模型的团队以及 OpenBMB 这样开放的大模型社区。


 🧑  孙同学—山西大学研究生 

在面壁智能实习的这几个月,在各位同学,同事的指导与合作下,我有幸为 BMTrain、ModelCenter 等开源工具包开发了一些新的特色功能。在这里,我能感受到大家对 最新的AI科研技术的蓬勃热情,在看到其他同学和同事的PR时,我意识到我们不仅追求做到一件事,更想要把事情做好。

在这里,标准的工作流程和高效的协作使得开发事半功倍,同时也 没有传统职场的交流压力,对各种新的技术与科研成果,都可以畅所欲言。导师制的实习培养方案,使得我能够快速的掌握领域现状,积累研究经验,并即时得到反馈,从而快速迭代自己的知识库。

最后,感谢各位老师和同事,为我提供了这样的实习机会,后面我将继续在大模型领域深耕钻研。



官方网站

https://www.openbmb.org


技术文章

Delta Tuning 登陆 Nature子刊 | 大模型工具学习引擎 BMTools

CPM-Ant 训练完成 | BMInf 适配GLM-130B

高效训练工具 BMTrain BMTrain 技术原理

CPM-Live 邀请函 CPM-Live 训练启动

OpenBMB 社区介绍 | 大模型课程

大模型榜单 BMList


交流QQ群
735930538

欢迎转载
商务合作请联系
openbmb@gmail.com

👏期待您的关注与加入👏

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存