2023年6月29日,人工智能(AI)聊天机器人ChatGPT的研发公司OpenAI在美国旧金山面对集体诉讼。诉状指OpenAI为追求利润,违反隐私法,从互联网上窃取大量个人信息,用于训练人工智能模型。美国克拉克森律师事务所星期三(6月28日)向旧金山联邦法院提交一份厚达175页的诉讼书,指OpenAI秘密从互联网窃取了3000亿个单词,挖掘范围包括书籍、文章、网站和贴文,以及未经同意获取的个人信息。大规模盗取信息 包括从Slack和Teams收集私人对话根据诉状,OpenAI大规模盗取互联网用户与该公司产品的互动信息,以及集成了ChatGPT的应用中的隐私数据,并将这些信息用于该公司产品的模型训练。受害者据称可能多达数百万人,潜在损失高达30亿美元(约40.6亿新元)。通过将ChatGPT集成到应用,OpenAI可从社媒应用Snapchat收集图像和位置数据、从音乐平台Spotify收集用户音乐偏好、从数码付款平台Stripe收集财务信息,还可从协作办公软件Slack和Teams收集私人对话。诉状指OpenAI违反服务协议条款,以及州、联邦隐私和财产法。其他指控还包括侵犯隐私、盗窃、不当得利和违反《电子通信隐私法》等。原告谴责OpenAI为追逐利润,已经放弃“以最可能惠及全人类的方式”推进AI发展的初心。除了要求法院判定赔偿金数额之外,他们还要求暂时冻结对OpenAI产品的商业访问和进一步开发。ChatGPT是OpenAI旗下颇受欢迎的AI产品,既掀起社会对AI技术前景的强烈兴趣,也引发人们对隐私安全和错误信息等风险的担忧。“人工智能教父”辛顿(Geoffrey Hinton)星期三在演讲中敦促政府介入,在AI技术开发和监管之间作出平衡,在AI变得比人类更聪明之前,投入大量资源,防止AI夺走人类对社会的掌控权。也有反对者说,辛顿的担忧堪比“谈论火星人口过剩”,将AI视作生存威胁为时过早。但辛顿认为,这并非杞人忧天,风险真实存在,人们需要未雨绸缪,以便更好地应对。辛顿也指出,AI将加剧不平等,它带来的巨大生产力收益,惠及的是富人而非工人,对社会非常不利。这起集体诉讼引发了广泛的讨论,人们开始对人工智能技术的潜力和隐患产生浓厚兴趣。同时,这也引发了对创意产业前景以及辨别事实和虚构能力的质疑。
OpenAI 并不是唯一一家借助互联网获取大量数据来训练 AI 模型的公司。谷歌、Meta、微软和越来越多的其他公司都在做同样的事情。
全球科技巨头如谷歌(Alphabet)、微软和Meta等公司也开始采取措施,以防范ChatGPT可能导致的敏感数据泄露风险。随着ChatGPT的使用量迅速增长,他们对于保护用户隐私产生了更多的担忧。
这场诉讼案件将进一步引发人们对隐私保护和错误信息的关注,并促使科技公司采取更严格的安全措施来确保用户数据的安全性。
OpenAI 的训练数据问题不断被暴露
自去年 11 月发布 ChatGPT 以来,生成式人工智能由于其可以创建文本、音频、图像、视频等大受欢迎。人们一直寻求将生成式人工智能用于个人、专业和学术目的,尽管有人担心它对个人数据带来威胁。今年6月,日本个人信息保护委员会(PPC)宣布根据《个人信息保护法》(APPI)向ChatGPT开发商OpenAI发布行政指南。ChatGPT不得在未经事先同意的情况下从用户和非用户处获取需要特别注意的个人信息。同时,必须使用日语告知或公开个人信息的使用目的。日本对OpenAI发出警告:未经许可不得收集敏感数据!
而一些公司,包括亚马逊和微软,已经指示员工不要将机密信息输入到聊天机器人。与此同时,三星已全面禁止员工使用生成式人工智能工具。由数据安全域综合整理,转载请注明来源。