抄袭可耻,但 AI 就可以?GitHub Copilot拿用户的开源代码改一改就去挣钱!
全球最大同性交友网站Github最近骂声四起,起因是刚发布的Copilot被推上了「侵权」的风口浪尖。网友表示:你再训练都是基于我们的开源代码,这改一改就想用来赚钱真的好么?
Github和OpenAI联合发布的AI代码生成工具——Copilot,看起来简直就编(mo)程(yu)神器。
全球最大同性交友网站Github最近骂声四起,起因是刚发布的Copilot被推上了「侵权」的风口浪尖。网友表示:你再训练都是基于我们的开源代码,这改一改就想用来赚钱真的好么?
Github和OpenAI联合发布的AI代码生成工具——Copilot,看起来简直就编(mo)程(yu)神器。
Copilot不仅能依据程序员写的几行注释生成对应的代码,而且还可以根据代码的上下文自动补全整段函数。
在1750亿个参数的GPT-3语言模型的加持下,其核心Codex模型接受了来自GitHub的数十亿行开源代码的训练。
显然,Copilot的效果十分理想,用过的人都对其大加赞赏。
「Copilot似乎确切地知道我接下来要输入的内容,而且Copilot在处理React组件时特别有用,它可以做出非常准确的预测。」
GitHub的CEO Nat Friedman也非常兴奋地表示:「每天都有数百名GitHub的开发者在使用Copilot,如果预览版进展顺利的话,我们将计划在未来某个时候将其扩展为付费产品。」
等一下,GitHub这是把开源的代码一波操作之后变成「付费」的产品?
网友们一下子炸了,看这架势是要无视General Public License?
「他们自己承认,Github Copilot接受了大量GPL(通用公共许可证)代码的训练,这难道不是一种将开源代码清洗为商业产品的形式么。『它通常不会重现精确的代码』这个声明很难令人满意。」
GPL——通用公共许可证是什么?
根据维基百科的解释,GNU General Public License,中文翻译为通用公共许可证,简称GPL,是一系列自由软件许可证,可保证用户运行、研究、共享和修改软件的自由。
同时,GPL是一个Copyleft许可证,这意味着任何衍生作品都必须遵循相同或等效的许可条款。
GNU官网对于GPL的解释说,如果你想把修改过的GPL代码向公众发布,就需要提供源代码。
https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container
GPL许可证系列一直是开源软件领域中最受欢迎的软件许可证之一。其中就有大名鼎鼎的Linux内核。
对于Linux的成功,GPL在其中也扮演了至关重要的位置,它保证了为内核做出贡献的程序员的工作保持自由,而不是被他人利用。
而Copilot用基于GPL的代码进行训练这件事,网友概括道:「GPL明确声明『不要将我的工作放在专利软件中』,而Copilot则是一种将他们的工作放在专利软件中的机制。」
有网友表示不解:「为什么这是一个问题?GPL不是说可以自由地共享和修改代码?」
「是的,GPL允许共享和修改代码,但必须将其作为GPL发布。」
也有网友表示:「你怎么知道『你想出来』的代码不是源自GPL的代码?」
「但是,人类也通过阅读开源代码来学习,所以这不是一回事么?」
「不,人类具有抽象的理解能力,并有广泛的知识可供借鉴,而统计模型没有。」
「人类开发人员在大量封闭和开源项目上进行训练,并反刍他们作为片段藏起来的代码,是在创作衍生作品吗?」
「呃,是的,如果你『隐藏』了GPL代码的片段,然后将其复制粘贴到商业项目中,这听起来就像是在违反许可。」
难道真能用别人的代码赚钱?
针对把别人的代码商用化这件事,甲骨文对谷歌侵权的诉讼可以说是一个非常著名的案例了。
其中的争议集中在Java的部分API和约11,000行源代码的使用上,这些源代码归甲骨文所有,而谷歌则把它们用在早期的安卓操作系统上。
甲骨文提起诉讼,称这些API是受版权保护的,要求谷歌从侵权的安卓版本的销售和许可中获得88亿美元的损害赔偿。
虽然两次地区法院级别的陪审团审判都支持谷歌,但联邦巡回法院推翻了这两项决定,声称 API受版权保护,并且谷歌的使用不属于合理使用。
谷歌在2019年的任期内成功向最高法院申请审理此案,重点关注API的版权和后续合理使用。2021年4月,最高法院以6比2的裁决裁定谷歌对Java API的使用属于合理使用。该决定推翻了联邦巡回法院的裁决,并将案件发回重审。
网友调侃道:「在谷歌的某个地方:『我们有 0.1% 的机会从甲骨文中逐字复制一小块代码,我们应该使用它吗?』」
反方观点
「被视为一个受版权保护『作品』的『衍生作品』,必须包括原始作品的『实质性』部分。而Copilot自动生成的5行函数不会被法律领域的任何人视为『衍生作品』。」
对于AI学习了开源代码之后,重新组装并复用它们,而背后的公司则用这个AI去赚钱,同学们怎么看呢?
转自|新智元 来源:Reddit 编辑:好困