孫劍:曠視不需要用冠軍證明自己;看好自動機器學習技術
郭一璞 發(fā)自 高錕會議中心
量子位 報道 | 公眾號 QbitAI
“曠視成立8年了,不需要用這些冠軍、這些比賽來證明自己?!?/p>
在香港科學園高錕會議中心,曠視研究院院長孫劍這樣表達了他對今年CVPR曠視拿下6個冠軍的看法。
對孫劍來說,不管之前在MSRA,還是現(xiàn)在擔任曠視首席科學家,實用性都是他對于研究的第一考量。
在這場香港舉辦的人工智能及視覺高峰論壇間隙,我們向孫劍問了6個問題。
先簡要概述,孫劍老師提了以下觀點:
1、大灣區(qū)AI頂尖人才多,制造業(yè)中心深圳讓AI公司接觸到不同的實際需求。
2、看好自動機器學習,一方面可以提高效率,另一方面可能有新發(fā)現(xiàn)。
3、新人成長只有一條路,不停的做非常難、自己以前不擅長的問題。
以下內(nèi)容,量子位在不改變原意的基礎上略作了編輯。
MSRA和曠視在做研究這件事上有什么不同?
孫劍:大家對MSRA有誤解,覺得MSRA都是在做研究。確實微軟研究院有很多人在做研究,但也有很多人是做技術、并應用到產(chǎn)品上去。
因此在MSRA和曠視的工作本身很相似,做事情的原理方式基本一樣,因為我自己的風格偏實用,希望集中精力讓所做的研究能盡快產(chǎn)生價值。
來曠視的原因也是因為深度學習影響巨大,能對世界作出很大的改變,創(chuàng)業(yè)公司最接近前線,能最快把這些技術應用上去。而且,深度學習有各種各樣的應用場景,很多場景因為大公司有主營業(yè)務不一定關心,而小公司會去做這些場景,能看到行業(yè)里的亟需解決的本質問題,帶來不同的認識。
無論在MSRA還是曠視,大原則基本上是一樣的,研究需要找到核心問題,投入精力和時間,堅持去做,“堅持”的品格不管在哪里都是非常重要的,圖像識別是一個長期的任務,我們要投入很多精力。
我們相當于在做公司的研發(fā)大中臺。很多時候是在不斷提高精度,跟做研究的過程是一樣的,爭取把效果做到最好。因此,需要用研究的方法來解決,需要聚焦在視覺的核心問題上,不斷投入人和精力,不斷前進,這樣產(chǎn)品技術才能不斷進步,這是我們能夠很好地把研究和產(chǎn)品技術結合在一起的原因。
MSRA和曠視的規(guī)模不一樣,以前在微軟沒有這么多人同時做這件事,整個微軟研究院全球總共可能有50個計算機視覺研究員,當時在全球已經(jīng)是非常大的了。而我們現(xiàn)在曠視研究院的計算機視覺研發(fā)人員已經(jīng)接近500人,計算機視覺這一個問題可以投入更多精力、更多人來解決。
另外曠視也做底層訓練系統(tǒng),Brain++人工智能深度學習基礎框架,我們專門有工程團隊自研深度學習引擎。
如何看待曠視一個接一個的世界冠軍
前不久,量子位報道了曠視研究院算法總監(jiān)范浩強在CVPR上的第四個世界冠軍,此前曠視也拿到過幾屆MS COCO的數(shù)個項目冠軍。
孫劍:我們叫研究院,但一直都是產(chǎn)品技術優(yōu)先的一個研究院,也就是說,研究成果可以直接或間接應用到產(chǎn)品上去,這也是計算機視覺的特性,做出來可以廣泛使用,而不是本末倒置的要拿冠軍證明自己。
曠視成立8年了不需要用這些冠軍、這些比賽來證明自己,而是需要更強的、最好的、有差異化的產(chǎn)品來證明自己。
今年CVPR拿了6個冠軍,事前我都不知道他們參加了比賽。
至于發(fā)論文,我既不鼓勵也不反對,很多論文都是實習生做的,我們也會指導他們。
奪冠神器Brain++是怎樣的存在,和開源框架有什么區(qū)別?
孫劍:在曠視內(nèi)部,Brain++有兩層意思。狹義的Brain++指的是我們核心的訓練引擎,因為當時我們做的時候還沒有TensorFlow,我們Brain++第一版出來之后TensorFlow才發(fā)布,當時比的話,TensorFlow不算很成熟。但是我們比TensorFlow好,所以我們一直用自己的Brain++。
相比之下的優(yōu)點是,曠視的Brain++可以在計算機視覺方面的做很多特定的優(yōu)化。
TensorFlow是一個大的codebase,雖然是開源的,但還是一些核心部分還是Google在控制,定期會有更新。但我們做的各種應用需要很快對深度學習訓練引擎做出我們想要的改進,天下武功唯快不破,市場競爭要求我們必須要快。用自己的Brain++,我們想要一個功能,可能下周就做好放進去了,可以第一時間用上它,加快研發(fā)的速度。
而隨著研發(fā)的拓展,曠視在核心的訓練引擎是拓展出了自有的AI技術生態(tài),也就是廣義的Brain++。作為團隊協(xié)同平臺和算法工廠,廣義的Brain++不僅包含了原有的訓練框架,還有數(shù)據(jù)管理平臺和計算平臺。
今天曠視提到更多的是廣義的Brain++,作為公司級的AI訓練平臺,需要管理上萬塊GPU,讓很多人一起高效管理這些計算資源,數(shù)據(jù)量非常大,標準的開源系統(tǒng)無法完成這些東西。
曠視Brain++平臺的特色之一是每個人都可以當虛擬機一樣登上去,有別于其他大公司調(diào)試好之后提交job的方式,曠視用虛擬機的方式不僅能提供臺式機的體驗,還能在大規(guī)模系統(tǒng)上運行,邊訓練邊調(diào)試,這是別人做不到的,而這種方式對研究員的效率提升非常大。
另外,在有很多人一起共享計算資源的情況下,資源空閑的時候別人可以自動調(diào)動,這一套高效的東西也是Brain++來管理的。
Brain++平臺也支持使用TensorFlow、PyTorch等各種開源框架,目前我們的引擎非常完善,所以大家還是會主動選擇優(yōu)先使用自己的Brain++。這套工具的學習曲線非常平,新人可以很快學會。
香港和北京的AI發(fā)展又什么不同?
孫劍:不只香港,整個大灣區(qū)政府非常鼓勵AI的發(fā)展,創(chuàng)造好條件。香港學校培養(yǎng)出了高質量學生,學生資源非常好。本次來參會也是希望參與到大灣區(qū)AI的討論中來,希望能覆蓋灣區(qū)。
在香港的業(yè)界和學界,大家知道Face++這個產(chǎn)品,可能不太熟悉曠視這家公司,處于產(chǎn)品比公司火的狀態(tài)。
另外,我們和香港的一些計算機視覺教授有長期的合作,和權龍(香港科技大學教授)有曠視-港科大聯(lián)合實驗室,這個實驗室主要做3D和識別相結合的方向,另一方面我們也會聯(lián)合培養(yǎng)人才。
對比北京和香港的AI人才環(huán)境,北京的特點是人才密度高,總量大,是全國高校最多的城市。而在粵港澳大灣區(qū),AI頂尖人員很多,發(fā)展很快,環(huán)境好,對人才的吸引力大。有一個優(yōu)勢是全世界制造中心深圳在這里,因而有不同行業(yè)的需求,創(chuàng)業(yè)或者做別的都要從需求出發(fā),這是很大的優(yōu)勢,能夠更貼近客戶。
目前看好的那些新的AI技術?
孫劍:自動機器學習是一個很有希望的方向,自動機器學習不僅限于網(wǎng)絡結構模型,其實已經(jīng)是一種思想,在研發(fā)pipeline里,損失函數(shù)、訓練數(shù)據(jù)采樣/增強/增廣、超參數(shù)都可以搜索,不限于簡單的搜一個網(wǎng)絡結構,而是打開了一扇門,把很多新的思想融進來了,這套搜索工具方法打開了很多研究機會。
將來能帶來很多變化,一方面可以提高效率,不需要人工調(diào)優(yōu);另一方面可能真的能發(fā)現(xiàn)一些靠人工發(fā)現(xiàn)不了的事情。
CV新人的抉擇
孫劍:年輕人來曠視最大的訴求是追求成長,至少畢業(yè)后3~5年擺在第一位的是如何快速成長。
我們會給他們找夠難夠有挑戰(zhàn)性的任務,幫助他們成長,研發(fā)過程中不光關心項目,也關心每個人,怎么激勵他們,讓他們能夠加速成長。
我們也分了團隊,這些梯隊的負責人比我剛來的時候成長了非常非常多。成長只有一條路,不停地解決非常難、自己以前不擅長的問題。這樣才能源源不斷地成長,建成梯隊以后他們也會帶著更多新加入的年輕伙伴不停成長。
成長中的焦慮是個必須的過程,如果沒有焦慮那可能就成長得很慢,你需要有這個焦慮的過程,就像讀博士都有一段黑暗期、迷茫期,看不到希望,這個黑暗期過去之后你就會變得更強大。
面對焦慮,第一,我們研究院講勇敢的成長,開放心態(tài),growth mindset,成長心態(tài),很多東西都是可以改變的;第二,我們追求敢做難的事情、有挑戰(zhàn)的事情,要勇敢接受挑戰(zhàn)。
對于計算機視覺領域的新人,希望能扎扎實實做事情,把事情的基本原理搞清楚,有成長心態(tài),不停地提升自己。
如果你去讀博士的話會有3~5年的時間節(jié)奏是比較慢的,可以讓你認真深入思考一個問題,真正把一個方向的問題思考明白。去公司的話,研究水平高的人很集中,跟很多做計算機視覺的實驗室比,我們是排在前面的,這樣可以讓你獲得加速的成長。