行业动态 | 18个月,OpenAI这支团队搞出了GPT-4o
奥特曼:如果没有他(Prafulla Dhariwal)的远见、才华、信念和决心,就不会有 GPT-4o。
「GPT-4o 的诞生离不开 @prafdhar 的远见、才华、信念和长期以来的坚定决心。正是这些努力(以及许多其他人的工作)促成了我希望会成为计算机使用方式革命的成果。」
在 OpenAI 发布新一代旗舰生成模型 GPT-4o 后的两天,OpenAI CEO 奥特曼对参与该项目的其中一位负责人评价道。
紧随其后,联合创始人 Greg Brockman 表示:「GPT-4o 是整个团队努力的结果。特别要感谢 @prafdhar,他坚信能够构建一个全能模型,并在过去 18 个月里通过与 OpenAI 的多个团队展开合作,从而实现了这一目标。」
看到这,估计大家都很好奇,prafdhar 到底是谁,他就是 Omni 团队负责人 Prafulla Dhariwal,也是 GPT-3、DALL-E 2 共同创造者。Dhariwal 表示「GPT-4o(o 代表 omni)是 Omni 团队推出的首个模型,也是 OpenAI 首个原生的全多模态模型。这次发布是整个组织共同努力的结果」。同时,Dhariwal 提到他想特别感谢团队中一些出色的成员,正是他们让这个神奇的模型成为可能!
Dhariwal 口中出色的团队成员到底有谁,整个团队贡献者都有哪些,接下来我们将为大家一一揭晓。
Prafulla Dhariwal
Prafulla Dhariwal 是 OpenAI 的一名研究科学家(也是前文奥特曼特别感谢的人),研究方向主要是生成式模型和无监督学习。他在 2017 年加入 OpenAI,至今已有 7 年多的时间。
Prafulla Dhariwal 本科毕业于麻省理工学院。在 MIT,Prafulla Dhariwal 主要学习计算机科学、数学、物理学,并在 MIT 大脑、思维和机器中心担任本科生研究员。
根据 Google Scholar 显示,Dhariwal 论文引用次数达到 72200 多次,参与的研究包括 DALL-E 2、DALL-E 3、Glow、Consistency Models 等,都是大家比较熟悉的。
James Betker
James Betker 是 OpenAI 的研究工程师,主要研究图像和音频的生成式建模。
在加入 OpenAI 之前,James Betker 在 GARMIN 国际航电瑞士有限公司担任了 12 年的软件工程师,并曾在谷歌担任软件工程师。
Rowan Zellers
Rowan Zellers 是 OpenAI 的研究员,致力于构建通过语言、视觉和声音理解人类和世界的机器。
Prafulla Dhariwal 表示:「Rowan Zellers 的研究工作让 GPT-4o 能够像人类一样自然地观看视频。」Rowan Zellers 也是 GPT-4 研究团队成员之一。
Alexis Conneau
Alexis Conneau 现在为 OpenAI 音频 AGI 研究负责人。Dhariwal 表示 Conneau 比 OpenAI 的任何人都更早地提出了 HER 的愿景,并坚持不懈地执行!
Gabriel Goh
Gabriel Goh 为 OpenAI 机器学习研究员,他对可解释性、机器学习、数据可视化和凸优化感兴趣。曾经参与了 DALL・E 1、DALL・E 3、GPT-4 等的研究。
Ishaan Gulrajani
Ishaan Gulrajani 现在为 OpenAI 机器学习研究者,此前他博士毕业于斯坦福大学,曾经参与过 Alpaca、Stanford alpaca 等的研究。
Alex Nichol
Alex Nichol 在 OpenAI 从事深度学习研究,DALL-E 2 共同创造者,擅长代码、人工智能和 3D 打印。
Li JING
Li JING 是 OpenAI 的研究员,在 GPT-4o 工作中主要进行图像 / 3D 生成方面的研究。
Li JING 也是 DALL・E 3 和 Sora 的研究团队成员。Li JING 的研究工作致力于帮助人工智能理解现实世界并创造新的智能。
Casey Chu
Casey Chu 是 OpenAI 的一名研究员,研究多模态人工智能系统,参与过 GPT-4、DALL・E 2 的研究。此前,他博士毕业于斯坦福大学。
Mark Chen
中间一位是 Mark Chen
Mark Chen 为 OpenAI 前沿研究主管,5 月 14 日凌晨发布会现场就有他的身影,Mark Chen 曾参与过 DALL・E、GPT-4 等的研究。
Jiahui Yu
Jiahui Yu 在 OpenAI 领导感知团队,此前,他在伊利诺伊大学厄巴纳 - 香槟分校获得博士学位。在加入 OpenAI 之前,Jiahui Yu 在谷歌参与的研究包括 Gemini、PaLM 2 等。
Huiwen Chang
Huiwen Chang 于 2023 年加入 OpenAI,此前她在谷歌担任高级研究科学家,本科毕业于清华大学。
A. Jabri
A. Jabri 为 OpenAI 的技术人员,主要研究领域是用于自监督和无监督学习的可扩展目标和架构。此前曾在谷歌 DeepMind 实习。
Christine McLeavey
Christine McLeavey 是 OpenAI 的技术团队成员,主要进行多模态研究工作。她的研究兴趣主要在于音乐生成,她也是 OpenAI 音乐模型 MuseNet 研究团队成员。
Yu Zhang
Yu Zhang 是 OpenAI 技术团队成员,曾在 Google DeepMind 担任了 6 年的研究科学家。
Yu Zhang 本科毕业于上海交通大学计算机科学系,博士毕业于 MIT 计算机科学系。
除了上面提到的这些研究者,OpenAI 官方也放出了完整名单:
完整名单地址:https://openai.com/gpt-4o-contributions/
其中,语言方面的核心贡献者包括:
多模态核心贡献者包括:
感兴趣的读者,可以查看完整名单了解更多信息。
群内会定期推送语言服务行业最新动态、活动预告、竞赛通知📝等内容~
欢迎你的加入🥰!
往期回顾
2. 行业资讯 | 新增山东省高校!已有19所高校申请翻译博士专业学位
3. 行业动态 | 中国翻译协会医学翻译委员会2024年第一次主任会议在京召开4. 行业资讯 | “新汉学计划”欢迎加入!2024年外语翻译硕士培养项目开始招生5. 行业动态 | “人工智能+”首次写入《政府工作报告》,大模型如何助力产业创新?
行业洞见
行业洞见 | 《翻译技术研究》作者王华树教授 行业洞见 | 为腾飞助力:AI 如何为翻译引擎增加动力 行业观察 | 人工智能教父谈人工智能的影响和潜力 行业观察 | 奥特曼专访:关于 GPT-5、Sora、Ilya、Q*、AGI、外星人等等一切
行业技术
行业技术 | 带你了解大语言模型的前世今生 技术应用|Mac和Win如何协作制作双语平行语料库? 技术应用 | 翻译实践中术语库的应用 技术应用 | 术语库创建与应用 技术应用 | 7个技巧让你成为谷歌Gemini专家
精品课程1. 超值秒杀 | 大语言模型辅助外语教学研修班
2. 活动预告 | 崔启亮老师:GenAI时代的语言服务行业实践与研究专题课
3. 今晚7点 | 高效办公利器:大语言模型助力Office插件应用技巧分享
4. ChatGPT系列课程 | 亲身体验火爆AI学习热潮,拓展你的技能边界!
资源干货
技术科普 | 揭开手写文本识别“最先进”的秘密 资源干货 | 英语外刊获取途径、网站推荐 ChatGPT | AI外语写作助手,助力高效写作 双语干货 | 谢锋大使向中美媒体发表讲话 资源宝库|译者用“典”,多多益善——精选31款在线词典
招聘就业
1. 北京/西安 | 博硕星睿销售岗位,不限经验,等你来投!【可线上】
2. 招聘快报 | CNBC财经电视台上海分公司招聘发行部助理实习生