Copilot要攤官司了!工作20年老程序員重新激活律師證,發(fā)起集體訴訟,還喊網(wǎng)友加入
正式發(fā)布僅4個(gè)月
豐色 Alex 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
距離正式發(fā)布才剛4個(gè)月,GitHub Copilot即將迎來一場集體訴訟!
發(fā)起人是一位干了20多年的程序員,來自美國的馬修·巴特里克(Matthew Butterick)。
他早在今年6月就“捶”了Copilot的開源許可證問題。
現(xiàn)在,馬修終于決定邁出實(shí)質(zhì)性的一步,在迅速激活自己的律師資格證后,和其他幾位律師一起合作“聲討”Copilot。
(這位老哥身兼數(shù)職,除了這倆身份還是設(shè)計(jì)師)
他在一篇專門的個(gè)人博客中細(xì)究了Copilot涉及的兩大法律問題,并指出Copilot不僅是“偷代碼”那么簡單,還會對整個(gè)開源社區(qū)造成諸多不良影響:
或許你不介意它未經(jīng)許可就用了你的開源代碼,但如果它也將由此抹去你和開源社區(qū)之間的聯(lián)結(jié)呢?
(若不明白這句話具體何義,請接著往下看~)
目前,這篇博客已在推特上得到了不少關(guān)注和轉(zhuǎn)發(fā)。
相關(guān)消息還引爆了Hacker News社區(qū)。
Copilot有哪些問題?
先給不熟悉的朋友簡單介紹一下Copilot。
它是內(nèi)嵌在Visual Studio等IDE中的一個(gè)代碼自動(dòng)補(bǔ)全工具,支持多種主流編程語言。
根據(jù)已寫的內(nèi)容,它可以給出后續(xù)代碼建議——不過和我們見到的普通自動(dòng)補(bǔ)全功能不同,它可以生成諸如整個(gè)函數(shù)體這樣的大段代碼。
今年6月,Copilot在經(jīng)過一年的免費(fèi)試用后正式轉(zhuǎn)為付費(fèi)工具,定價(jià)為10美元/月(人民幣約67元),年付則是100美元/年(人民幣約669元)。
它的到來,讓很多人都感嘆入門級別的程序員沒有用了。
不過問題也隨之而來。
Copilot強(qiáng)大的編碼能力來自于一個(gè)叫做Codex的AI,由OpenAI開發(fā)并授權(quán)給微軟。
Codex是怎么訓(xùn)練的呢?
盡管微軟含糊其辭,表示它的訓(xùn)練源是數(shù)億行公共代碼;但Copilot的研究員還是道出了實(shí)情,都是出自于Github上的公共倉庫。
好了,馬修要狀告Copilot的第一個(gè)問題,也就跟Copilot的訓(xùn)練過程有關(guān)。
馬修表示,微軟和OpenAI要想用Github上的開源倉庫進(jìn)行訓(xùn)練,要么遵守它們的開源許可證協(xié)議,要么「合理使用」。
如果是前者,微軟和OpenAI應(yīng)該至少發(fā)布大量的attri-bu-tion來獲得許可,但是大家沒有看到。
他們將自己歸到了后者,如GitHub前CEO Nat Fried-man在Copilot的技術(shù)預(yù)覽會所說:
在公開數(shù)據(jù)上訓(xùn)練(機(jī)器學(xué)習(xí))系統(tǒng)屬于合理使用。
不過,軟件自由保護(hù)組織(Software Freedom Conservancy,SFC)不同意這一“空口無憑”的說辭,要求他們提供法律依據(jù)來支撐自己的立場。
但是遲遲沒有得到答案。
馬修表示,這就是因?yàn)槲④浐蚈penAI給不出來啊。
第二個(gè)可能違法的問題,則是關(guān)于Copilot的使用。
馬修指出,微軟在面對Copilot用戶時(shí)對自己進(jìn)行了免責(zé)。
微軟將Copilot給的代碼稱為“建議”,稱自己不從中主張任何權(quán)力,也不對它生成的代碼作任何關(guān)于正確性、安全性和產(chǎn)權(quán)相關(guān)的保證。
一旦你接受了Copilot給出的“建議”,如果出了問題都由你自己負(fù)責(zé)。
乍一聽還好,可是不止一人發(fā)現(xiàn)Copilot一字不差地把原作者的代碼當(dāng)成“建議”丟給用戶,連注釋都一并奉送的那種。
這要是直接采納可就要涉及許可問題了,可是Copilot根本不會注明這些代碼的來源,又該讓用戶如何遵守協(xié)議呢?
以上,便是馬修要控訴的兩大問題。
除此之外,他還表達(dá)了對開源社區(qū)文化的擔(dān)憂。
他認(rèn)為,Copilot的所作所為直接在程序員和開源社區(qū)之間砌起了一堵墻,讓程序員只管任意享用現(xiàn)成代碼,遠(yuǎn)離源代碼本身,失去與源項(xiàng)目的問題討論、bug跟蹤等互動(dòng)和貢獻(xiàn)。
而這對開源社區(qū)將是一個(gè)永久的、痛苦的損失。
另一邊,對于“無故”奉獻(xiàn)了訓(xùn)練代碼的開源作者來說,他們儼然被當(dāng)作了資源的生產(chǎn)者。
馬修將這類人比喻成奶牛,由于Copilot對他們的項(xiàng)目沒有任何貢獻(xiàn),他表示這奶牛是只出奶卻不被提供食物和住所的奶牛。
因此,他也將Copilot的本質(zhì),比喻為寄生蟲。
此外,你可能聽聞?dòng)腥顺鲇趹嵟瓕⒆约旱拇a搬出了GitHub。
馬修告訴大家:其實(shí)微軟通過聲稱訓(xùn)練AI是合理使用,正在搜索網(wǎng)上任何可以使用的公共代碼進(jìn)行訓(xùn)練。
可以說是“逃無可逃”。
于是在避免傷害變得無法彌補(bǔ)之前,馬修聲稱必須弄清Copilot的合法性。
他呼吁以下幾類人群加入他們的調(diào)查和訴訟隊(duì)列:
當(dāng)然在博客最后,馬修還是特別聲明:
我本身并不反對AI輔助編程工具。
他提到,Copilot本可以也很容易變得“友好”,比如讓作者自愿參與,或者有償征用。
質(zhì)疑聲從未停止
這次,看到有人帶頭牽起對Copilot的集體訴訟,許多程序員以及計(jì)算機(jī)相關(guān)領(lǐng)域的大佬們紛紛表示:
“附議!”
消息出來之后,德克薩斯A&M大學(xué)的一位計(jì)算機(jī)科學(xué)教授,并兼任ACM、IEEE和SIAM會員的Tim Davis順勢發(fā)推分享了自己的“遭遇”:
Copilot沒有拿到LGPL許可證(函數(shù)庫公共許可證),就擅自發(fā)出了大段我的版權(quán)代碼。
并附上了證據(jù):
△ 左為Copilot給出的代碼,右為他自己的代碼
有網(wǎng)友表示:
Copilot的這種行為屬于是完全不尊重開源社區(qū)。
還有網(wǎng)友犀利地指出,在模型訓(xùn)練過程中,所謂的AI“學(xué)習(xí)”,本身就是一種被勉強(qiáng)挪用過來的概念:
因?yàn)閾?jù)現(xiàn)有法律,人類閱覽受版權(quán)保護(hù)的資料用于自己學(xué)習(xí),是合法的;然后各大科技公司說,AI也會“學(xué)習(xí)”,所以AI也沒有違反版權(quán)法。
但是AI并不像人類那樣自主(盡管很多公司稱AI很自主),這些模型其實(shí)都被背后的組織或公司等操控著,所以用“學(xué)習(xí)”來描述AI做的事并不太準(zhǔn)確。
而且真人其實(shí)也經(jīng)常出現(xiàn)會違反版權(quán)法等問題……
所以,要定義AI在“學(xué)習(xí)”過程中到底是否“抄襲”了,以及存在具體哪種侵權(quán)行為,是一個(gè)非常棘手的問題,還需要更多的討論和明確規(guī)定。
誠然,Copilot從去年的內(nèi)測階段起,其出色的編程能力確實(shí)驚艷了不少人。
而且這個(gè)AI后來還學(xué)會了“反向輸出”:
用“人話”來講解某一段代碼有什么用,幫助屏幕前的人看懂代碼。
但另一方面,不只現(xiàn)在,其實(shí)從Copilot剛出來開始,一直就有眾多質(zhì)疑和反對的聲音,核心都不外乎馬修在前文舉證的那兩點(diǎn)。(即這個(gè)AI的訓(xùn)練和使用)
也正如前文所說,除了個(gè)人,還有SFC等組織也在聲討Copilot。
而在今年6月份,GitHub宣布Copilot結(jié)束內(nèi)測,開啟收費(fèi)模式后,更是將大家的不滿情緒拔到了最高點(diǎn)。
除了免費(fèi)引流再收費(fèi)的商業(yè)模式讓人反感外,大家一致認(rèn)為這的AI用開發(fā)者寫的代碼來訓(xùn)練,不應(yīng)該回過頭向再開發(fā)者收費(fèi):
每一個(gè)曾向GitHub提交過代碼的人都應(yīng)免費(fèi)使用!
于是,Copilot正式版立刻遭到了抵制——
SFC不僅自己要退出GitHub,而且還號召其他軟件開發(fā)商同樣照做。
在VS Code插件市場上,Copilot原本一直是5星好評,也一下子涌入了不少一星差評。
One More Thing
本次事件還讓人把目光延伸到了AI繪畫領(lǐng)域,有網(wǎng)友認(rèn)為:
這種工具同樣也涉及侵權(quán)等問題。
最后,對于“大伙兒現(xiàn)在聯(lián)合把Copilot告上法庭”這件事,你覺得贏的勝算大嗎?
參考鏈接:
[1]https://githubcopilotinvestigation.com/
[2]https://twitter.com/DocSparse/status/1581461734665367554
[3]https://news.ycombinator.com/item?id=33240341