被罵了三年,谷歌Dropout專利還是生效了,卡脖子預警
別急,2034年就過期了。
栗子 李根 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
谷歌的Dropout專利,6月25日生效了。
有效期15年。
所謂Dropout是一種搞深度學習、訓練神經(jīng)網(wǎng)絡時,普遍會用到的方法,由Hinton于2012年提出,可以有效防止過擬合。
三年前,因為谷歌給Dropout申請了專利,就已經(jīng)引發(fā)過一次業(yè)界嘩然。當時,reddit上有個熱帖,言辭激烈的把谷歌、還有當時未獲圖靈獎的Hinton等人統(tǒng)統(tǒng)給“問候”了一個遍。
歷史證明,罵街是沒有用的。如今,Dropout依然是AI領域的必備武器,而且——谷歌已經(jīng)確定地拿到了專利授權。
先不要慌。
你看,網(wǎng)友@peng321就說:
別擔心,只要等到2034年,它就過期了。
當然,在Dropout專利過期之前,所有人,所有要用到Dropout的人、公司、機構,都可能要面臨一個被掐脖子的尷尬境地。
reddit網(wǎng)友@rantana總結了一下:
- 如果你是一家試圖融資的創(chuàng)業(yè)公司,在你的算法中使用谷歌的專利,會影響你的估值。
- 如果你跟谷歌有專利糾紛,起訴人家前要三思,分分鐘反訴你。
- 如果你是谷歌的專利律師,恭喜你成人生贏家。
Dropout是啥?
專利的名字是:解決神經(jīng)網(wǎng)絡過擬合的系統(tǒng)與方法 (英文如下) 。
看看摘要,就知道Dropout的基本原理:
這是一個用來訓練神經(jīng)網(wǎng)絡的系統(tǒng)。特征檢測器 (Feature Detectors) 上面,都連著一個開關,至少網(wǎng)絡的某些層是這樣。
在每一個training case里,開關都會隨機關閉一些特征檢測器,是根據(jù)一個預先配置的概率來決定的。
然后,每個訓練案例的權重,會被歸一化 (Normalized) ,以將神經(jīng)網(wǎng)絡應用在測試集上。
至于為什么能防過擬合,Hinton爺爺和小伙伴們,在CNN成名作ImageNet Classification with Deep Convolutional里面,大致講到了這樣的意思:
每次關掉一半的特征檢測器,每次訓練的都是不一樣的網(wǎng)絡。然后取各種網(wǎng)絡的平均,用來預測。這樣可以提升模型的穩(wěn)定性,或是泛化能力,防止過擬合。
專利文件上填的發(fā)明者,也是這篇論文的各位作者,只不過申請者是谷歌:
關于專利都包含了哪些內(nèi)容,谷歌列舉了20條,細數(shù)了各種想到、想不到的訓練步驟:
算是Dropout的一份優(yōu)秀使用說明了。
如果大家在打擊過擬合的過程中,產(chǎn)生了困惑,大可以進去查一查。
當然,這不是重點。
關鍵是,以后再用Dropout,會受到怎樣的限制???
開源的重大障礙
名叫mtanti的網(wǎng)友問:
就是說我們以后都不能用Dropout了么?
樓下 (NicolasGuacamole) 的回答很精彩:
誰用了,就拿無人機除掉誰。
戲謔是其中一種態(tài)度,把它用正常的句子講出來就是:
谷歌也不會真的去用這項專利的。
當然,不是所有人都這樣看。
其實,早在三年前,這項專利已經(jīng)獲批,并且激起了嚴重的反彈。
△ Dropout專利申請授予信息
至于是預見到了怎樣的未來,才會生出這樣的情緒,網(wǎng)友 (AnonMLResearcher) 認真地分析過:
曾經(jīng)有人說“不要怪玩家,要怪就怪制定游戲規(guī)則的人?!?/p>
就是說,我們不應該指責谷歌,應該指責專利制度。
既然允許這樣著名的抽象概念被注冊專利,谷歌也有他們的合法權利。
我只是害怕,這可能會對機器學習的學術研究帶來重要的損害。
在視覺領域,SIFT和SURF已經(jīng)被注冊了專利。這樣,像OpenCV這樣的開源庫,就十分困擾了。
repo里面沒有包含“不免費 (Nonfree) ”模塊,所以用戶要從源代碼開始自己搭建,就很麻煩。
以后,開源機器學習庫還是會遇到同樣的事情。
卡脖子預警
而且Dropout這樣的基礎算法成谷歌專利,之所以備受關注,影響還不止于開源社區(qū)。
網(wǎng)友 (AnonMLResearcher) 說:
這樣的專利,對任何年輕的機器學習公司都會有影響,讓他們更難吸引到投資——現(xiàn)在谷歌對許多算法已經(jīng)有知識產(chǎn)權了,(如果使用專利代碼) 隨時可能被起訴。
一度引起廣泛討論的“徐匡迪之問”,也再次被拿出來討論。
今年5月,上海院士沙龍活動中,中國工程院院士徐匡迪等多位院士尖銳一問:中國有多少數(shù)學家投入到人工智能的基礎算法研究中?
尷尬現(xiàn)狀是,中國AI的應用雖然當前如火如荼,但自主知識產(chǎn)權的底層框架和核心算法非常缺乏,更多還是依靠開源代碼和算法。
接受科技日報采訪的浙江大學應用數(shù)學研究所所長孔德興教授就呼吁:如果缺少核心算法,當碰到關鍵性問題時,還是會被人“卡脖子”。
孔教授說,開源代碼是可以拿過來使用,但專業(yè)性、針對性不夠,效果往往不能滿足具體任務的實際要求??捉淌谡J為,是否掌握核心代碼將決定未來的AI“智力大比拼”中是否擁有勝算。
而今年一而再的例子已經(jīng)證明,核心算法靠燈塔,即便口碑如谷歌,可能也會有斷供的一天。
所以Dropout成谷歌專利,不只關于開源,不只停留在科研,還關乎更致命的自主核心算法和背后的“卡脖子”困境。
— 完 —
- 馬云正式卸任后,阿里巴巴開盤跌0.87%2019-09-10
- AI獨角獸云知聲,已完成一期科創(chuàng)板IPO輔導2019-10-17
- 亞馬遜在華拓展云計算團隊,挑戰(zhàn)阿里巴巴和騰訊2019-10-16
- IDC:今年上半年中國公有云服務市場規(guī)模達54.2億美元2019-11-07