查看原文
其他

抄袭可耻,但 AI 就可以?GitHub Copilot拿用户的开源代码改一改就去挣钱!

21CTO 2021-10-21

     

全球最大同性交友网站Github最近骂声四起,起因是刚发布的Copilot被推上了「侵权」的风口浪尖。网友表示:你再训练都是基于我们的开源代码,这改一改就想用来赚钱真的好么?


Github和OpenAI联合发布的AI代码生成工具——Copilot,看起来简直就编(mo)程(yu)神器。

 

Copilot不仅能依据程序员写的几行注释生成对应的代码,而且还可以根据代码的上下文自动补全整段函数。

 

在1750亿个参数的GPT-3语言模型的加持下,其核心Codex模型接受了来自GitHub的数十亿行开源代码的训练。

 

 

显然,Copilot的效果十分理想,用过的人都对其大加赞赏。

 

「Copilot似乎确切地知道我接下来要输入的内容,而且Copilot在处理React组件时特别有用,它可以做出非常准确的预测。」

 

 

GitHub的CEO Nat Friedman也非常兴奋地表示:「每天都有数百名GitHub的开发者在使用Copilot,如果预览版进展顺利的话,我们将计划在未来某个时候将其扩展为付费产品。」

 

等一下,GitHub这是把开源的代码一波操作之后变成「付费」的产品?

 

 

网友们一下子炸了,看这架势是要无视General Public License?

 

「他们自己承认,Github Copilot接受了大量GPL(通用公共许可证)代码的训练,这难道不是一种将开源代码清洗为商业产品的形式么。『它通常不会重现精确的代码』这个声明很难令人满意。」

 

 

GPL——通用公共许可证是什么?


根据维基百科的解释,GNU General Public License,中文翻译为通用公共许可证,简称GPL,是一系列自由软件许可证,可保证用户运行、研究、共享和修改软件的自由。 


 

同时,GPL是一个Copyleft许可证,这意味着任何衍生作品都必须遵循相同或等效的许可条款。

 

GNU官网对于GPL的解释说,如果你想把修改过的GPL代码向公众发布,就需要提供源代码。

 

https://www.gnu.org/licenses/gpl-faq.zh-cn.html#language-container

 

GPL许可证系列一直是开源软件领域中最受欢迎的软件许可证之一。其中就有大名鼎鼎的Linux内核。 

 

对于Linux的成功,GPL在其中也扮演了至关重要的位置,它保证了为内核做出贡献的程序员的工作保持自由,而不是被他人利用。

 

而Copilot用基于GPL的代码进行训练这件事,网友概括道:「GPL明确声明『不要将我的工作放在专利软件中』,而Copilot则是一种将他们的工作放在专利软件中的机制。」

 

 

有网友表示不解:「为什么这是一个问题?GPL不是说可以自由地共享和修改代码?」

 

「是的,GPL允许共享和修改代码,但必须将其作为GPL发布。」

 

 

也有网友表示:「你怎么知道『你想出来』的代码不是源自GPL的代码?」

 

 

「但是,人类也通过阅读开源代码来学习,所以这不是一回事么?」

 

「不,人类具有抽象的理解能力,并有广泛的知识可供借鉴,而统计模型没有。」

 

 

「人类开发人员在大量封闭和开源项目上进行训练,并反刍他们作为片段藏起来的代码,是在创作衍生作品吗?」

 

「呃,是的,如果你『隐藏』了GPL代码的片段,然后将其复制粘贴到商业项目中,这听起来就像是在违反许可。」

 

 

难道真能用别人的代码赚钱?


针对把别人的代码商用化这件事,甲骨文对谷歌侵权的诉讼可以说是一个非常著名的案例了。

 

其中的争议集中在Java的部分API和约11,000行源代码的使用上,这些源代码归甲骨文所有,而谷歌则把它们用在早期的安卓操作系统上。

 

 

甲骨文提起诉讼,称这些API是受版权保护的,要求谷歌从侵权的安卓版本的销售和许可中获得88亿美元的损害赔偿。

 

虽然两次地区法院级别的陪审团审判都支持谷歌,但联邦巡回法院推翻了这两项决定,声称 API受版权保护,并且谷歌的使用不属于合理使用。

 

谷歌在2019年的任期内成功向最高法院申请审理此案,重点关注API的版权和后续合理使用。2021年4月,最高法院以6比2的裁决裁定谷歌对Java API的使用属于合理使用。该决定推翻了联邦巡回法院的裁决,并将案件发回重审。

 

网友调侃道:「在谷歌的某个地方:『我们有 0.1% 的机会从甲骨文中逐字复制一小块代码,我们应该使用它吗?』」


 

 

反方观点


「被视为一个受版权保护『作品』的『衍生作品』,必须包括原始作品的『实质性』部分。而Copilot自动生成的5行函数不会被法律领域的任何人视为『衍生作品』。」




对于AI学习了开源代码之后,重新组装并复用它们,而背后的公司则用这个AI去赚钱,同学们怎么看呢?


转自|新智元  来源:Reddit  编辑:好困


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存