Copilot被索賠90億美元!因侵權(quán)問(wèn)題,20年程序員激活律師證對(duì)其發(fā)起集體起訴
這是美國(guó)首個(gè)挑戰(zhàn)AI系統(tǒng)訓(xùn)練和輸出的集體訴訟案件
Alex 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
“這個(gè)AI正在實(shí)施規(guī)??涨暗能浖謾?quán)盜版行為!”
正式發(fā)布不到5個(gè)月,GitHub的敲代碼神器Copilot已惹怒一眾程序員,甚至攤上了官司:
被集體訴訟、按每條違法行為的最低法定賠償額計(jì)算,需賠償90億美元?(約合人民幣647億元)。
訴訟的發(fā)起者,一位干了20多年的老程序員Matthew Butterrick(馬修)憤然對(duì)其給出上述評(píng)價(jià)。
其實(shí)在10月份,馬修就公開(kāi)表示要告Copilot。現(xiàn)在他和優(yōu)秀的幾位律師一起前往加州舊金山的美國(guó)聯(lián)邦法院,對(duì)Copilot提出集體訴訟。
申訴中還提到,Copilot涉嫌多次違反《加州消費(fèi)者隱私法》:
就算每個(gè)用戶在整個(gè)使用過(guò)程中只收到一次違法輸出,那么GitHub和OpenAI都已經(jīng)違法了3600000次。
馬修指出:
要是再不管管Copilot,它將成為少數(shù)特權(quán)者從大多數(shù)人工作中獲利的一種新方式。
他們將Copilot告上法庭的舉動(dòng)受到了眾多網(wǎng)友的關(guān)注和支持。不少人表示,雖然Copilot確實(shí)功能強(qiáng)大,但它現(xiàn)在就是非法的,沒(méi)有任何借口。
被索賠90億美元,Copilot出了哪些問(wèn)題?
簡(jiǎn)單來(lái)說(shuō),Copilot的主要問(wèn)題可以概括為“侵權(quán)”二字:
包括侵犯眾多代碼原創(chuàng)者的版權(quán),以及侵犯眾多用戶的隱私等。
而致此情況背后的原因,可以看成主要和兩個(gè)方面有關(guān)。
一是Copilot的訓(xùn)練過(guò)程。
Copilot強(qiáng)大的編碼能力來(lái)自于一個(gè)叫做Codex的AI。Codex是OpenAI獨(dú)立開(kāi)發(fā)的一個(gè)模型,他們將此模型授權(quán)給了微軟。
Codex是怎么訓(xùn)練的呢?
盡管微軟含糊其辭,表示其訓(xùn)練源是數(shù)億行公共代碼;但Copilot的研究員后來(lái)還是道出了實(shí)情,都是出自于GitHub上的公共倉(cāng)庫(kù)。
馬修表示,微軟和OpenAI要想用GitHub上的開(kāi)源倉(cāng)庫(kù)進(jìn)行訓(xùn)練,要么遵守它們的開(kāi)源許可證協(xié)議,要么合理使用。
但馬修和其他幾位律師認(rèn)為微軟等既沒(méi)有發(fā)布大量的attri-bu-tion來(lái)獲得許可,也沒(méi)真正地“合理使用”。
于是他們?cè)谏暝V詞中指出:
Codex在沒(méi)有遵守適用許可條款的情況下,輸出了受版權(quán)保護(hù)的材料 。
微軟他們未經(jīng)代碼擁有者的授權(quán),擅自修改了多項(xiàng)版權(quán)管理信息,例如:標(biāo)題和作者名稱等。這些都違反了美國(guó)《數(shù)字千年版權(quán)法》(DMCA)中的相關(guān)規(guī)定。
除了訓(xùn)練過(guò)程,第二點(diǎn)則是關(guān)于Copilot的使用。
馬修指出,Copilot正式版在今年6月份正式發(fā)布,定價(jià)10美元/月,但微軟等一面收著前一面還對(duì)自己進(jìn)行了免責(zé)申明。
(就是說(shuō),你可以用,但出了事別找我)
微軟將Copilot給的代碼稱為“建議”,稱自己不從中主張任何權(quán)力,也不對(duì)它生成的代碼作任何關(guān)于正確性、安全性和產(chǎn)權(quán)相關(guān)的保證。
一旦用戶接受了Copilot給出的“建議”,如果出了問(wèn)題都由用戶自己負(fù)責(zé)。
而且這些“建議”在很多時(shí)候?qū)κ褂谜邅?lái)說(shuō)并不太適用:
Copilot可能會(huì)一字不差地把原作者的代碼直接丟給用戶,連注釋都一并奉送的那種。
這要是直接采納可就要涉及版權(quán)和許可等問(wèn)題了,可Copilot壓根兒沒(méi)有注明這些代碼的來(lái)源,所以用戶也難以遵守協(xié)議。
本次訴訟的具體申訴文件長(zhǎng)達(dá)56頁(yè),馬修已經(jīng)將其上傳到了一個(gè)專門(mén)的網(wǎng)站上。(參考鏈接1)
馬修表示,他們會(huì)在訴訟期間在此網(wǎng)址上及時(shí)更新當(dāng)前進(jìn)展。
Copilot都惹惱了誰(shuí)?
其實(shí)迄今為止,Copilot的“侵權(quán)”問(wèn)題已經(jīng)引發(fā)了諸多不同群體的強(qiáng)烈抗議。
其一就是馬修等辛苦自研代碼的程序員們。
馬修等人認(rèn)知,自己辛辛苦苦寫(xiě)的代碼就這么被挪用了,實(shí)在不能忍!
值得一提的是,馬修這位老哥擁有眾多技能:他不僅是一個(gè)經(jīng)驗(yàn)豐富的老“碼農(nóng)”,還有哈佛大學(xué)的視覺(jué)研究學(xué)位,并已獲得了律師資格證。
除了……現(xiàn)在不玩某藍(lán)色小鳥(niǎo)軟件了(手動(dòng)狗頭)。
而且在今年6月份,Copilot結(jié)束內(nèi)測(cè)開(kāi)啟收費(fèi)模式后,大家的不滿情緒更是瞬間高漲。
許多人指出:免費(fèi)引流再收費(fèi)的商業(yè)模式讓人反感;而且大家一致認(rèn)為這個(gè)AI用開(kāi)發(fā)者寫(xiě)的代碼來(lái)訓(xùn)練,不應(yīng)該回過(guò)頭向再開(kāi)發(fā)者收費(fèi):
每一個(gè)曾向GitHub提交過(guò)代碼的人都應(yīng)免費(fèi)使用!
現(xiàn)在,馬修終于聯(lián)手幾位律師把Copilot告上了法庭,他們稱這是美國(guó)第一個(gè)挑戰(zhàn)AI系統(tǒng)訓(xùn)練和輸出的集體訴訟案件。
除了軟件開(kāi)發(fā)者們,計(jì)算機(jī)領(lǐng)域的一些學(xué)者也對(duì)Copilot頗有微詞。
在聽(tīng)說(shuō)馬修他們要起訴Copilot后,德克薩斯A&M大學(xué)的一位計(jì)算機(jī)科學(xué)教授,并兼任ACM、IEEE和SIAM會(huì)員的Tim Davis也發(fā)推分享了自己的“遭遇”:
Copilot沒(méi)有拿到LGPL許可證(函數(shù)庫(kù)公共許可證),就擅自發(fā)出了大段我的版權(quán)代碼。
另外,軟件自由保護(hù)協(xié)會(huì)SFC等組織也在積極聲討Copilot。
SFC是一個(gè)旨在為自由開(kāi)源軟件項(xiàng)目提供支持和基礎(chǔ)設(shè)施的非營(yíng)利組織。
其實(shí)自從微軟及其子公司 GitHub在去年首次推出Copilot 以來(lái),SFC 就一直在試圖與他們溝通。
SFC之前也向微軟他們提出了版權(quán)和許可證相關(guān)的問(wèn)題,但微軟等一直拒絕明確回答。
現(xiàn)在,SFC不僅自己已經(jīng)停止使用微軟 GitHub來(lái)開(kāi)展項(xiàng)目托管,而且還號(hào)召其他軟件開(kāi)發(fā)商同樣照做。
參考鏈接:
[1]https://GitHubcopilotlitigation.com/
[2]https://www.bleepingcomputer.com/news/security/microsoft-sued-for-open-source-piracy-through-GitHub-copilot/
[3]https://news.ycombinator.com/item?id=33485544