co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者

co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
图片来源@视觉中国
文 | 光锥智能,作者|陈思
6 月下旬,微软旗下代码托管平台 GitHub 推出了能够对整行或全部代码给出 AI 分析建议的 Copilot 编程辅助工具。
这款工具不仅能够支持多种编程语言,还可以给出开发者修改建议,甚至根据简单的文字描述生成代码段。
然而,这款怎么看都觉得是提升开发人员工作效率的工具,一经推出后,迎来的几乎没有欢呼,更多的是来自开源作者们的批判。
代码未经许可被拿走,开源作者们怒了“他们不打一声招呼,就直接拿走我们的代码去训练他们的AI模型,这简直太过分了!”
在Twitter、Hackernews等社交平台以及论坛上,越来越多的开发者发出了对GitHub以及微软公司的声讨,更有甚者宣布自己今后将不再使用GitHub:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
(大意:我不同意 GitHub 未经授权和未经许可就使用受版权保护的源代码作为其基于机器学习的GitHub Copilot产品的训练数据。该产品将受版权保护的代码注入其客户的软件中,而无需获取原始代码创作者的许可。我认为这是对版权所有者权利的严重攻击,因此我不会继续使用 GitHub 的服务。)
要了解开发者们的愤怒源头,首先要知道一下GitHub Copilot是什么。
GitHub Copilot是基于非盈利技术组织OpenAI的一个代码补全项目CodeX创建的。根据官网介绍,Copilot可以实现以下功能:
根据函数名称补全代码:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
根据注释所写逻辑,直接实现代码:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
【 co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者】自动补全重复代码:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
在测试的时候,直接生成与代码相匹配的测试模块:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
从功能上来看,这都是一个对开发者非常友好的工具,对提升工作效率非常有帮助,这一点在国内外的开发者论坛中也得到了不少的好评。
可为什么它让这么多开发者愤怒呢?
既然是AI工具,总得有一个训练数据的来源吧?没错,正如文章开头说的那样:GitHub Copilot的训练数据全都是站内开发者贡献的开源代码,且并未告知开发者,这也是开发者们愤怒的直接来源。
据了解,微软未来还计划将GitHub Copilot做成收费的企业版本,这一点则更让开发者们不爽:“免费拿了我们的代码去训练不说,还想用它来盈利,而且对于我们这些贡献者,微软一丁点补偿都没有!”
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
(大意:我知道有人对这个工具很兴奋,但是GitHub偷拿了你的代码,用它训练了这个AI,甚至还考虑在未来向你收费。)
不少开发者认为,这样的行为是非常严重的侵权。随着话题不断发酵,GitHub Copilot被“骂上热搜”,甚至一度占据HackerNews热度榜第二的位置。
GitHub深陷侵权漩涡起初,还有一些开发者认为,GitHub本身作为一个开源代码托管的平台,应该不至于做出如此过分的事情,然而当他们发送邮件向官方询问后,却得到了令他们失望的回复:
co|GitHub用AI帮程序员补全代码,却惹怒了一群开源作者
文章插图
(大意:这位开发者想知道当GitHub选择代码进行训练时,会不会区分许可证?然而官方的回复是,所有公开的代码都会拿来训练,并不会区分许可证。)