OpenAI如何組織員工學(xué)習(xí)?這里有一份課程與書籍清單
魚羊 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
在人工智能領(lǐng)域,知識(shí)的更新速度超乎想象,去年BERT還制霸各大排行榜,轉(zhuǎn)眼XLNet又來了。
對(duì)于AI公司的員工來說,若不追逐技術(shù)的浪潮,就很有可能在人工智能時(shí)代的激烈競(jìng)爭(zhēng)中越來越力不從心。
及時(shí)迭代技術(shù),正與公司的期待不謀而合。AI公司本身當(dāng)然也不希望看到員工被技術(shù)瓶頸卡住。
那么,那些走在人工智能浪尖的大公司,都是怎么組織員工緊跟AI技術(shù)風(fēng)向的呢?
OpenAI主動(dòng)把星期四設(shè)成了學(xué)習(xí)日,讓員工可以自由學(xué)習(xí)日常工作中學(xué)不到的東西。
每周四,不用管手頭的項(xiàng)目,想看啥論文就看啥論文,哪怕是復(fù)習(xí)復(fù)習(xí)線性代數(shù),那也是極好的。
媽媽再也不用擔(dān)心我把線代知識(shí)全還給了老師。
難怪有網(wǎng)友說:好想加入OpenAI啊。
自由學(xué)習(xí)的工作日
這個(gè)學(xué)習(xí)日,到底是怎么一回事呢?
OpenAI的說法是,在這一天里,員工們可以自由地學(xué)習(xí)想學(xué)的知識(shí),只要他們覺得這些新技能能幫助自己提升工作水平,并且在日常的工作中并沒有機(jī)會(huì)學(xué)到。
拿OpenAI的機(jī)器人團(tuán)隊(duì)舉個(gè)例子,在這一天里,他們通常會(huì)做這些事情:
- 閱讀AI論文
- 重現(xiàn)AI論文
- 學(xué)習(xí)AI教程
- 開展自己的AI項(xiàng)目
- 學(xué)習(xí)數(shù)學(xué)基礎(chǔ):線性代數(shù),統(tǒng)計(jì)學(xué)等等
- 學(xué)習(xí)機(jī)器學(xué)習(xí)基礎(chǔ):信息論,貝葉斯推理等等
- 學(xué)習(xí)工程方面的知識(shí):了解最新的編程語言,框架等等
- 學(xué)習(xí)管理方面的知識(shí):自我管理,優(yōu)先排序,知名實(shí)驗(yàn)室都怎么運(yùn)作blabla
- 學(xué)習(xí)機(jī)械工程或開展機(jī)械工程研究項(xiàng)目
- 學(xué)習(xí)任何可以幫助提高工作水平的技能,比如寫作
以上也只是建議,深度學(xué)習(xí)一下《權(quán)重不可知的神經(jīng)網(wǎng)絡(luò)》當(dāng)然很好,《黑暗領(lǐng)域:網(wǎng)絡(luò)戰(zhàn)爭(zhēng)秘史》這種歷史讀物也一樣沒什么問題,甚至,公司還給你報(bào)!銷!
量子位曾解讀《權(quán)重不可知的神經(jīng)網(wǎng)絡(luò)》:https://mp.weixin.qq.com/s/mQ01MkRCWL0gZVtVWZmbJw
想鞏固一下數(shù)學(xué)知識(shí)?買書!請(qǐng)老師!別猶豫,OpenAI投資你!
簡(jiǎn)直令人感動(dòng)。
來自機(jī)器人團(tuán)隊(duì)的妙想
OpenAI周四學(xué)習(xí)日現(xiàn)在已經(jīng)普惠到全公司,成為公司文化的重要組成部分。
不過在一開始,是機(jī)器人團(tuán)隊(duì)做了第一個(gè)吃螃蟹的人。
機(jī)器人團(tuán)隊(duì)的負(fù)責(zé)人Woj(Wojciech Zaremba)是這樣想的:
我意識(shí)到我在許多領(lǐng)域面前止步不前,因?yàn)槿粘9ぷ髦杏刑嗑o急任務(wù)。而這對(duì)我的工作是很不利的,比如說,我一直想評(píng)估我的團(tuán)隊(duì)是否應(yīng)該更換深度學(xué)習(xí)框架,但我總是會(huì)被各種工作上的事打斷。
粗淺的零碎時(shí)間閱讀對(duì)此并沒有什么幫助。
最好的解決方案就是每天空出一天來學(xué)習(xí)。我想如果我需要這樣一天來提高我的工作效率,那么我的團(tuán)隊(duì)成員們也一樣有此需求。
短期生產(chǎn)力是會(huì)受到影響,但在一到兩年之內(nèi),由此產(chǎn)生的增長(zhǎng)就會(huì)顯現(xiàn)。
在實(shí)行了學(xué)習(xí)日計(jì)劃之后,僅僅過去了一個(gè)月,團(tuán)隊(duì)中研究員和工程師之間的交流就明顯順暢了起來,每個(gè)人都開始正確地使用術(shù)語。
半年之內(nèi),研究人員會(huì)討論用什么樣的設(shè)計(jì)重組代碼庫了,而工程師也更多地參與到了研究項(xiàng)目當(dāng)中。
鵝妹子嚶。
Woj提到,OpenAI一向鼓勵(lì)自學(xué),但光說鼓勵(lì),emmm,并沒有什么效果。
你招了一名工程師,你希望TA更懂機(jī)器學(xué)習(xí),一個(gè)月過去了,TA很可能還是對(duì)ML不明覺厲。
自從有了學(xué)習(xí)日之后,情況就不一樣了。
在機(jī)器人團(tuán)隊(duì)中,有成員本來對(duì)機(jī)器學(xué)習(xí)一無所知,三個(gè)月后,能給CV(計(jì)算機(jī)視覺)項(xiàng)目貢獻(xiàn)代碼了。
還有一位工程師大佬,學(xué)了RL(強(qiáng)化學(xué)習(xí))才半年,做出來的東西快趕上RL博士水平了。
跨領(lǐng)域人才在哪里都受歡迎,OpenAI也不例外。他們決心把學(xué)習(xí)日活動(dòng)推廣到全公司,在公司內(nèi)部發(fā)展多面手們。
畢竟,不懂?dāng)?shù)學(xué)的軟件工程師不是好機(jī)器學(xué)習(xí)科學(xué)家嘛。
實(shí)現(xiàn)細(xì)節(jié)
所以學(xué)習(xí)日等于多放一天假?
非也非也。
這不是休閑日,只是換一種努力工作的方式。
學(xué)習(xí)日,可是有很多細(xì)節(jié)的。
Q1:學(xué)習(xí)日被用來工作怎么辦?
首先,要保證體育課不變成作業(yè)課,啊呸,要保證學(xué)習(xí)日不變成普通工作日。
即使領(lǐng)導(dǎo)不著急,團(tuán)隊(duì)成員們還是可能想要更快地完成手頭的項(xiàng)目。
OpenAI的解決方式是,所有團(tuán)隊(duì)都在同一天舉辦學(xué)習(xí)日活動(dòng)。全公司的人都沒在工作,你還會(huì)選擇項(xiàng)目而不是那篇早就想好好拜讀一下的大神論文嗎?
Q2:學(xué)習(xí)日變成休閑日怎么辦?
又想重復(fù)周末葛優(yōu)躺一整天的操作?快別想了,每個(gè)團(tuán)隊(duì)成員都要在Geekbot的Slack上分享自己的學(xué)習(xí)進(jìn)展。
別人都五殺了你還蹲在家里喝泉水,還怎么跟小伙伴愉快地玩耍?
反正在OpenAI,程序員們都興奮地push了起來。
真是別人家的公司啊。
One More Thing
最后,來看看OpenAI員工們都學(xué)了什么吧。
深度學(xué)習(xí)論文:
Population Based Augmentation: Efficient Learning of Augmentation Policy Schedules:
https://arxiv.org/abs/1905.05393
Learning Domain Randomization Distributions for Transfer of Locomotion Policies:
https://arxiv.org/abs/1906.00410
Neural Graph Evolution: Towards Efficient Automatic Robot Design Learning to Learn with Probabilistic Task Embeddings:
https://bair.berkeley.edu/blog/2019/06/10/pearl/
Mid-Level Visual Representations Improve Generalization and Sample Efficiency for Learning Visuomotor Policies:
http://perceptual.actor/assets/main_paper.pdf
Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables:
https://arxiv.org/abs/1903.08254
Does computer vision matter for action?
https://arxiv.org/pdf/1905.12887.pdf
WAIC, but Why? Generative Ensembles for Robust Anomaly Detection:
https://arxiv.org/abs/1810.01392
Weight Agnostic Neural Networks:
https://arxiv.org/abs/1906.04358
Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations:
https://arxiv.org/abs/1811.12359
Deep unsupervised learning:
https://arxiv.org/abs/1811.12359
Deep RL Bootcamp:
https://sites.google.com/view/deep-rl-bootcamp/lectures
深度學(xué)習(xí)代碼:
Reptile and MAML
Play with code in JAX
Apply Sparse Transformers to vision tasks
Implement LSTM and transformer from scratch; train them on Penn treebank
Train a neural net to reproduce the behavior of a physical motor
數(shù)學(xué):
Time Series Analysis
The Book of Why: The New Science of Cause and Effect
歷史:
Dark Territory: The Secret History of Cyber War
The Hacked World Order: How Nations Fight, Trade, Maneuver, and Manipulate in the Digital Age
Technology Transfer to the USSR. 1928-1937 and 1966-1975: The Role of Western Technology in Soviet Economic Development
The Turing Test: Verbal Behavior as the Hallmark of Intelligence
The Information: A History, A Theory, A Flood
Radical Markets: Uprooting Capitalism and Democracy for a Just Society
參考資料:
https://openai.com/blog/learning-day/
— 完 —