GPT-4的黑箱运作方式引科学家不满
The following article is from Nature Portfolio Author Nature Portfolio
加星标,才能不错过每日推送!方法见文末动图
科研人员对这项AI技术充满期待,但对其底层技术的秘而不宣感到不满。
“现在需要在等位名单上排队,还不能立刻就用上。”阿姆斯特丹大学心理学家Evi-Anne van Dis说。不过,她已经见过GPT-4的demo。她说:“我们在视频里看过他们演示GPT-4的一些能力,简直超乎想象。”她记得,有一次演示用了一个网站的手绘插画,GPT-4能根据这些插画生成构建该网站的代码,证明它能将图像转化为输入信息的能力。
不过,OpenAI对它的模型使用哪些数据训练、如何训练,以及它的运作方式讳莫如深,这令科研人员感到不满。“所有这些闭源模型可以说是科学界的死胡同,”开源AI社区HuggingFace的气候科学家Sasha Luccioni说,“他们【OpenAI】可以在他们的研究基础上越攀越高,但对整个科学界来说,这就是条死路。”
“红队”测试
美国罗切斯特大学的化学工程师Andrew White以“红队队员”(red-teamer)的身份优先体验了GPT-4。OpenAI付费邀请这些红队队员测试该平台,他们会尝试让GPT-4做些不好的事情。他说,他在过去6个月都可以使用GPT-4。“与之前几代相比,一开始它好像也没什么特别之处。”
他会询问这个机器人合成某个化合物需要哪些反应步骤,让它预测反应产物并选择催化剂。“起初我没觉得它有多强大,”White说,“令人惊讶的是它看起来特别像回事,但它会在这里幻想出一个原子,在那里跳过一个步骤。”不过,就在他按照他们红队的任务给GPT-4开放科研论文的权限后,情况急剧变化。“我们发现,这类模型独立存在时可能没什么厉害之处,但当你把它和互联网和逆合成设计功能(retrosynthesis planner)等工具,或是和计算器相连,突然之间,新的能力全部出现了。”
当然,这些能力也伴随着隐忧。比如,GPT-4会允许合成危险化学品吗?利用White等人的输入信息,OpenAI的工程师再把这些信息“投喂”给他们的模型,让GPT-4避免生成危险、非法、有害的内容,White说道。
捏造事实
不实信息是另一个问题。Luccioni表示,GPT-4一类模型的功能是预测一句话的下一个词,所以无法完全摆脱胡编乱造的问题,这种现象也成为“幻觉”(hallucinating)。她说:“你不能全信这些模型,因为它的幻觉太多了。”即使是最新版本也仍有这个问题,她说,尽管OpenAI表示已经提升了GPT-4的安全性。
如果不公开训练所使用的数据,OpenAI关于安全性的担保在Luccioni看来是不够的。她说:“你不知道它用了哪些数据,你就无法优化它。我的意思是,把科研工作教给这样一个模型肯定是不现实的。”
围绕GPT-4训练方式的谜团对van Dis在阿姆斯特丹大学的同事、心理学家Claudi Bockting来说也是一个担忧。“让人类对他无法监督的东西负责是很难的,”她说,“一个担忧是它们的偏见可能远远超过人类自己的偏见。” Luccioni解释道,如果无法获得GPT-4的底层代码,你就无法判断偏见是来自哪里,自然也就没法纠正了。
伦理探讨
Bockting和van Dis还担心这些AI系统今后都会被大型科技公司收入麾下。他们希望这项技术能得到科学家的严格测试和验证。她说:“这里也有机遇,因为与科技巨头的合作能加快前进速度。”
van Dis、Bockting和同事在今年更早时指出,亟需建立一套“活”指南,指导AI和GPT-4等工具的使用和开发。他们担心关于AI技术的任何法规很难跟上AI发展的步伐。Bockting和van Dis已经组织4月11日在阿姆斯特丹大学召开研讨会,探讨上述问题,与会代表来自联合国教科文组织的科学伦理委员会、经济合作与发展组织、世界经济论坛等组织。
White认为,抛开种种顾虑,GPT-4及其未来迭代势必会重塑科学。他说:“我相信这将是科研基础架构的一次重大变革,堪比当初互联网带来的巨大震动。”它不会取代科学家,他说,但能协助科学家开展某些工作。“我认为我们将慢慢意识到,我们能把论文、数据程序、我们用的图书库与计算工作,甚至是机器人实验全部互联。
本文经授权转载自微信公众号“Nature Portfolio”,原文以GPT-4 is here: what scientists think标题发表在2023年3月16日《自然》的新闻版块上。原文链接:https://www.nature.com/articles/d41586-023-00816-5?utm_medium=organic_social&utm_source=wechat&utm_campaign=CONR_PF020_ENGM_AP_CNCM_002E6_all
相关阅读
2 深度剖析:ChatGPT 及其继任者会成为通用人工智能吗?| AI那厮
5 科学期刊禁止将ChatGPT列为论文作者,ChatGPT自己怎么看?
近期推荐
1 深度剖析:ChatGPT 及其继任者会成为通用人工智能吗?| AI那厮
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
长按下方图片关注「返朴」,查看更多历史文章