《AI已來:讓中國AI走向世界的王海峰》 獨特視角講述中國AI 30年
中國AI如何從貧瘠的孤島,走向世界?
金磊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
中國AI發(fā)展的三十年,從一個獨立而貧瘠的孤島,到如今的學術、應用百花齊放。
而這樣的歷史進程、如此迅猛的發(fā)展,中國的AI是如何做到的呢?
近期,正值哈爾濱工業(yè)大學建校百年之際,講述哈工大知名校友故事的“建校百年?哈工大人”系列叢書陸續(xù)上線。
而叢書之一的《AI已來:讓中國AI走向世界的王海峰》,便以中國AI領域年輕一代的領軍人物、百度首席技術官王海峰,在這一歷史進程中的親身經(jīng)歷,用獨特視角講述了中國AI如何用三十年時間,發(fā)展壯大至今。
從哈工大走出的機器翻譯科學家
30年前,中國的AI有多么貧瘠?
別說是AI了,就連電子計算器,在中國大陸的家庭中都是個稀奇物件。
而20世紀80年代初,卡內(nèi)基?梅隆大學已經(jīng)為DEC公司制造出了專家系統(tǒng),包括美國、日本在內(nèi)的許多國家都投入巨資開發(fā)所謂的第五代計算機,當時叫人工智能計算機。
直到20世紀80年代末,才出現(xiàn)了名為“286”的微型臺式電腦, 價格卻貴得要命,即使是大陸自攢的拼裝貨,往往也得五六千元。
而當時的工資水平,一位小學教師一個月的工資也只有60 元左右。
但是,中國人追趕現(xiàn)代科技的決心卻不可小覷。1984年以后,學電腦迅速在中國大陸成為一種新風尚。
也是從那時起,正在哈爾濱第三中學讀高中的王海峰,開始真正接觸計算機。他學會了打字、文檔處理、Basic編程等基本的電腦操作,為 以后的計算機生涯做好了基礎的知識和技能儲備。
高二的一場全國物理競賽中,黑龍江省只有15人進入決賽,王海峰便是其中之一,而決賽場地便設立在哈工大的實驗樓。
這一次的比賽經(jīng)歷,讓王海峰深刻體會到了哈工大工程師文化傳承下來的精神資產(chǎn)——其校訓:“規(guī)格嚴格,功夫到家”。
也成了他堅定不移的考取哈爾濱工業(yè)大學的原因。
1987至1993年,IBM的個人PC正式問世,蘋果開始推廣第一代臺式機。
當PC開始在發(fā)達國家普通家庭中普及的時候,當時人工智能硬件的代表——專為Lisp語言量身打造、能夠處理系統(tǒng)函數(shù)運算的大型計算機Lisp Machine迅速黯然失色,從先進技術 的代名詞變成了人們眼中的“廢物”。
于是,政府經(jīng)費開始收縮,研究項目陸續(xù)凍結(jié),多米諾骨牌效應之下,學界迎來了歷史上著名的“第二次人工智能寒冬”。
中國的人工智能研究,也是如此。
王海峰與NLP相遇
1989年,懷揣著科學夢想的王海峰進入了哈工大的“89322班”, 89意味著89級,3代表著計算機系,22則代表著硬件二班。在這一串數(shù) 字之中,王海峰開始與NLP結(jié)緣。
后來王海峰身上所展現(xiàn)的很多特質(zhì),其實在哈工大就讀期間就已經(jīng)能找到蹤跡。根據(jù)幾位同窗回憶:
王海峰身上有很多非?!肮ご蟆钡?地方。比如當年學生們在實驗室中得以接觸到286型號的老式計算機,游戲就成了一種很常見的娛樂方式,相比當時更為流行的格斗、賽車等等有強烈感官刺激的游戲,王海峰更喜歡招兵買馬、排列布陣的策略型游戲,享受動腦的樂趣。
又比如他自律到了同窗口中“收放自如”的地步,可能上一秒還在和大家一起笑鬧玩耍,下一秒意識到自己需要學習了,就能立刻停下手頭的事抄起書本。
大概就是因為這樣的個性,和對于AI一直以來的向往,王海峰在大四做畢業(yè)設計時來到了時任校黨委副書記的李生教授的實驗室。
在那里,王海峰以機器翻譯為媒介,真正與NLP相遇了。
1993年,在王海峰進入李生教授的實驗室時,CEMT系統(tǒng)已經(jīng)進化到第三代,也早已投入實際應用獲得了不少好評。
李生教授交給王海峰的任務,是對CEMT-III進行優(yōu)化。也就是說,雖然當時在很多人眼中NLP還是遙不可及的鏡花水月, 但王海峰所接觸的第一個項目,就是完全屬于應用性質(zhì)、真刀真槍直面用戶的。
這一點對于王海峰后來的學術研究,包括后來在百度工作,無形中都有著莫大的影響。
在李生教授的認可之下,王海峰開始以CEMT-III為契機推開NLP 寶庫的大門,雖然這一領域在當時遠不及今天熱鬧,甚至不被很多人看好。
王海峰參與的另一項任務,是漢英雙向機器翻譯,又稱BT863,是當時“863計劃”之一的項目。
當時正在讀研究生的王海峰,在BT863的漢譯英方向做規(guī)則知識庫的建構(gòu),以及計算機軟件等方面的準備。
雖然當時實驗室一年的經(jīng)費只有十幾萬元,一間二十幾平方米的房間密布著幾臺電腦,但在當時已經(jīng)屬于條件優(yōu)異了。
王海峰也深知這種 條件得來不易,幾乎扎根在實驗室里,和師兄弟以及導師一起為BT863 忙得日夜顛倒。
△1995年碩士期間,王海峰在哈工大實驗室留影
1995年,到了BT863進行最終測評的時候,王海峰取下了裝著整個系統(tǒng)的硬盤,小心翼翼地用紙包好,和同學、導師們一起坐上了前往北京的列車。
在測試過程中,哈工大的BT863在漢譯英部分獲得了全國第一。當時是在一分鐘左右完成了對200句話的翻譯。
在今天來看,這種速度幾乎不值一提,更何況整個程序還要裝在一 塊沉甸甸的硬盤里。但在當時,這一成績給了王海峰和其他哈工大人很大的鼓舞。
以至于準備碩士論文期間,王海峰也選擇了面向?qū)嵗?、基于模式的機器翻譯作為課題,那時這一課題從國內(nèi)學術進度來說還相對前衛(wèi)。王海峰的研究,從一定程度上講是在填補空白。
神經(jīng)網(wǎng)絡+機器翻譯的“首次中國之行”
1996年,王海峰開始在哈工大攻讀博士,由李生教授和時任哈工大校長助理的高文(現(xiàn)為中國工程院院士)共同培養(yǎng)。
而在此期間,他開始思考——自己能否去嘗試一些更新的東西。
同年,高文就任于國家智能計算機研究中心,與摩托羅拉共同設立的先進人機通信技術聯(lián)合實驗室(JDL),王海峰作為博士生也一起來到了北京。
JDL這種攜手外企巨頭,橫跨國家、連通校企的合作模式,在當時是十分罕有的,也從另外一種更獨特的角度開拓了他的國際視野。
同時也是從那時開始,摩托羅拉和科研機構(gòu)的產(chǎn)學聯(lián)合模式,讓王海峰第一次和產(chǎn)業(yè)界的真實需求有了親密接觸。
這種學術和產(chǎn)業(yè)的綜合視角,一直影響著王海峰本人,并且由他將這種影響帶到企業(yè)和很多學術組織中去。
當時,王海峰發(fā)現(xiàn)在海外(例如CMU),已經(jīng)開始有人將神經(jīng)網(wǎng)絡應用到語音處理之中。
不過當時應用更廣的是多層的BP神經(jīng)網(wǎng)絡,但其致命缺點,就是不能對上下文進行有效建模。
就此王海峰便在機器翻譯上開始了創(chuàng)新之旅,他的創(chuàng)新舉措在于,將循環(huán)神經(jīng)網(wǎng)絡的方法引入了機器翻譯領域,提出了在BP網(wǎng)絡基礎上增加一個循環(huán)層鏈接,形成循環(huán)神經(jīng)網(wǎng)絡(RNN),來反映上下文關系,取得了很好的效果。
那個年代,這個想法在國際上也屬超前。
△1999年3月,博士學位論文答辯會,與導師李生老師、答辯委員會老師合影
博士期間,王海峰根據(jù)對循環(huán)神經(jīng)網(wǎng)絡的應用,發(fā)表了《基于神經(jīng)網(wǎng)絡的漢語口語言語行為分析》、《基于神經(jīng)網(wǎng)絡的漢語口語多義選擇》等數(shù)篇論文。
在當時即使從世界范圍來看,將循環(huán)神經(jīng)網(wǎng)絡引入機器翻譯領域也不算常見,在國內(nèi)更是首創(chuàng)。
步入產(chǎn)業(yè),探索機器翻譯的應用價值
1998年,剛剛從美國來到北京的李開復,在中關村知春路上的希格瑪大廈建立了微軟中國研究院。
兩年后,其更名為微軟亞洲研究 院并沿用至今——這個地方,被稱為中國互聯(lián)網(wǎng)的“黃埔軍?!?。
1999年3月,剛剛博士畢業(yè)的王海峰,迎來了很多人都會面臨的人生抉擇:如何選擇職業(yè)方向?
李開復提議他加入微軟,因為微軟的Windows、Office等產(chǎn)品全世界都在用。
另一方面,王海峰對于學術研究同樣執(zhí)著,而想要同時兼顧學術道路與產(chǎn)業(yè)應用,當時的微軟中國研究院似乎就是“注定” 的那個選擇。
王海峰回憶說,自己在微軟中國研究院一共工作了15個月,最重要的是見識到了學術界以外,產(chǎn)業(yè)界如何思考問題、解決問題。
這對于此后他始終堅持走在產(chǎn)業(yè)一線,投身人工智能的產(chǎn)業(yè)化進程至關重要。
2002年,王海峰加盟了剛剛建立的東芝中國研究開發(fā)中心。
東芝中國研究開發(fā)中心剛剛建立,王海峰作為三名核心成員之一,參與了東芝中國研究開發(fā)中心的幾乎全部創(chuàng) 建工作。
在東芝這段時間,王海峰有較多的時間投入科研工作,進行了深入 廣泛的基礎研究積累,研究成果被應用于東芝的眾多產(chǎn)品中。當時的應 用之一,是東芝的車載芯片。
而這一呆,便是七載。
進入百度的十年
在東芝這七年間,王海峰已經(jīng)取得了較大的成就,成為國際NLP領域著名科學家,在自身職業(yè)生涯將滿十年的時候,開始審視起了自己的職業(yè)規(guī)劃。
王海峰當時對大環(huán)境的核心觀察是:
原本在技術領域具 備優(yōu)勢的外企正在逐漸走向緩慢發(fā)展。
而中國本土企業(yè),尤其是互聯(lián) 網(wǎng)企業(yè)正在迎來高速發(fā)展階段。
緣何選中百度?
而王海峰在當時“山頭林立”的眾多互聯(lián)網(wǎng)公司中,緣何選中百度?理由有二。
首先,從技術人才進行職業(yè)抉擇的大方向上看,百度自誕生起就是一家具有技術基因、工程師文化的公司。而且立足于搜索引擎的百度,客觀上來說蘊藏著AI研究者夢寐以求的寶藏。
另一方面,立足于搜索引擎的百度,又是連接千萬用戶的一個技術出口。
據(jù)王海峰自己回憶:
2007年的時候,我就感覺到未來是屬于中國本土企業(yè)的。而從我依然希望投身產(chǎn)業(yè)界的角度來看,高速發(fā)展的互聯(lián)網(wǎng)產(chǎn)業(yè)是最佳選擇。
在互聯(lián)網(wǎng)公司中,百度顯然又是最擅長技術, 最尊重技術人才的。
而期間發(fā)生的一件事情,成立王海峰加入百度的“定心丸”。
2009年8月,百度召開了第四屆“百度世界大會”,李彥宏在本次大會中推出了全新計算平臺“框計算”。
這項技術概念,是指百度用戶可以在“百度框”中輸入服務需求,系統(tǒng)就能通過理解用戶輸入的語言指令,對需求進行智能化理解,然后將其分配給最優(yōu)的內(nèi)容資源或應用提供商處理,最終返回給 用戶匹配后的結(jié)果。
而百度的“框計算”構(gòu)想,恰好讓王海峰看到了自身所學的用武之地。
△2010年,百度NLP團隊合影
初入百度的王海峰,由于此前的專業(yè)是機器翻譯,而機器翻譯與百度的搜索引擎技術體系,事實上存在著不少范圍上的出入。但王海峰的 學習能力和工作精力,讓這個出入很快得到了填補。
王海峰的到來,讓百度又多了一絲學術氣息,并開始邁出了參與國家項目的科研腳步。
在此之前,百度很少參與國家項目的申請,這類項目往往都是科研院所申請。但在國際上,很多高科技公司都會參與其中。
王海峰下決心改變現(xiàn)狀,沒人寫申報材料,他自己來寫。
在成果上,王海峰也和團隊取得了飛速的成就。
當時百度參加了國家高技術研究發(fā) 展計劃中的機器翻譯項目。在立項時,王海峰表示他們可以在中英機器翻譯上超過谷歌,當時在場的很多專家都表示難以置信。
事實是最 好的證明,這一項目的執(zhí)行周期原本為三年,而百度翻譯在一年多的時間里,就在中譯英準確率上超過了谷歌。
在百度“種植”AI
2010年王海峰在百度正式開啟工作時,所做的第一件事就是成立 了“自然語言處理部”。
以服務搜索引擎中產(chǎn)生的相關需求,進而又在語音、圖像技術上推進當時名為“多媒體部”的誕生,以及敲定了 百度在知識圖譜技術上的研發(fā)投入。
對于今天的百度來說,這三個方向的累積可以說是為后續(xù)AI技術 從無到有、深入發(fā)展奠定了至關重要的基礎。
例如2011年,百度推出的基于機器翻譯 技術的產(chǎn)品“百度翻譯”,就是在NLP部門的支持下完成,隨后不斷在這一產(chǎn)品框架下進行技術的更新迭代。
正是這種高頻 應用場景和先進技術的碰撞,讓百度在2015年推出了世界上第一款互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡翻譯系統(tǒng),跑贏了谷歌、微軟等企業(yè)。
但王海峰對自己在百度的定位,遠不止于NLP,應當是把基礎的學術能力泛化輸出。
于是幾乎在成立了NLP部門的同一時期,王海峰就已開始著手布 局語音技術和視覺技術,牽頭組建了當時的“多媒體部”。
在王海峰的極力推動下,“多媒體部”很快就取得了大量的研發(fā)成果:
- 在語音方面, 有圍繞語音識別的復雜聲學建模、海量語言模型和高速解碼等關鍵技 術;
- 在圖像方面,則進一步推進了圖像識別、圖像分類、圖像搜索以及OCR等技術的完善。
在這一時刻,百度也在某種程度上完成了從產(chǎn)品需求引領技術更 新,到技術進化推動產(chǎn)品革新的發(fā)展。
在2012年年中,百度多媒體部門開始推動這些技術的產(chǎn)品化,使其進入了用戶的視野。
- 建立在圖像的智能化理解能力之上,多媒體部門推出了一款圖片搜索引擎“百度識圖”。
- 語音的智能化理解則被整合到了移動端,在手機百度、百度輸入法、百度地圖等產(chǎn)品中加入了 語音輸入功能。
2017年,百度股價再創(chuàng)巔峰,AI成了最重要的功臣。
其中很大 一部分原因在于,百度不僅用AI技術對原有業(yè)務進行了提升,還進入了自動駕駛、語音交互硬件等全新的領域。業(yè)務范圍的拓展,顯然和技術能力的拓展不無關系。
建立在這一基礎之上,AI技術能力的累積,讓百度在AI發(fā)展方向上,可以直接走向C端市場而不是僅僅向B端提供技術賦能。
如今從百度AI的全面布局來看,王海峰建立的多媒體部,以及帶領多媒體部所累積下的基礎,可以說是確定了百度AI未來的發(fā)展軌跡。
與此同時,在從學界到產(chǎn)業(yè)的不斷探索中,王海峰發(fā)現(xiàn)了一個很有趣的問題,即“開源”和“開放”兩個概念的異同。
在科技企業(yè)的開發(fā)者生態(tài)中,開源是一種很普遍的文化,開發(fā)者們彼此分享源代碼,通過對代碼的修改編譯來完善產(chǎn)品。
很快王海峰 就發(fā)現(xiàn),對于AI來說,僅僅開源是不夠的。大部分渴求應用AI技術的產(chǎn)業(yè)中并不具備專業(yè)的技術人才,對于它們來說,需要的是一個操作 簡便的平臺,提交數(shù)據(jù)后就能直接獲得結(jié)果。
于是在機器翻譯、NLP等領域取得突破成就的同一時期,他開始向前推進百度更大圖景的技術平臺化政策。
直到如今,我們?nèi)阅軌蚩吹桨俣燃夹g平臺化的第二步工作——不 斷打造可供產(chǎn)業(yè)全流程使用的平臺和工具接口,深入細節(jié)場景,最終 形成了我們所看到的百度大腦AI開放平臺。
△2019年,王海峰代表百度發(fā)布百度飛槳最新成果
通過百度大腦開放軟硬件產(chǎn)品與服務、專項解決方案、定制化訓練平臺和深度學習開放平臺。
尤其是深度學習開放平臺飛槳,以及基于飛槳打造的定制化訓練與服務平臺EasyDL,這二者的存在,在中國AI產(chǎn)業(yè)化發(fā)展的藍圖上 畫下了重要的一筆。
除此之外,既然要做“泛化輸出”,就需要緊隨科技發(fā)展的時代浪潮。
對于云和產(chǎn)業(yè)智能化,王海峰也沒有落下。
今年5月,王海峰發(fā)布百度智能云全新戰(zhàn)略,他表示:
全新升級的百度智能云,融合云計算、百度大腦、大數(shù)據(jù)等百度核心技術,正在把人工智能輸送到千行萬業(yè)。
也正是王海峰如此的戰(zhàn)略,讓百度的每一個“節(jié)點”,無論是百度大腦、飛槳還是智能云,都成為能夠支持產(chǎn)業(yè)智能化、AI進入工業(yè)生產(chǎn)重要的環(huán)節(jié)。
即便時至今日,王海峰在百度這片沃土上,已經(jīng)讓AI“遍地開花”,但真正的“結(jié)果”,還遠不止于此。
中國AI走向世界、未來
三十年河東,三十年河西,中國AI從一個獨立而貧瘠的孤島,發(fā)展到了如今“無處不在的盛況”。
從王海峰個人在這三十年的AI浪潮故事中,可以用別樣的視角,洞察到這期間中國AI點點滴滴的變化。
而更直觀的,可以看下一組數(shù)據(jù):
- 德國公司IPlytics發(fā)布了一項關于人工智能技術專利的研究報告,報告分析了2008—2019年的448684項專利,結(jié)果顯示,截至2019年1月,中國平均每年的專利申請達到了66508項,位列世界第二。
- 中國新一代人工智能發(fā)展戰(zhàn)略研究院發(fā)布的《中國新一代人工智能 科技產(chǎn)業(yè)發(fā)展報告(2019)》和《中國新一代人工智能科技產(chǎn)業(yè)區(qū)域競爭力評價指數(shù)(2019)》顯示,在應用層面的專利申請上,中國已經(jīng)位列世界第一。
- 同時,報告還顯示,我國論文發(fā)文量居全球第一,論文總被引次數(shù)位列全球第二??梢娫谌瞬欧矫?,中國也在瘋狂追趕。
當然,這樣的數(shù)據(jù),還有很多很多。
而從一無所有,到如今在國際成為不可或缺,絕不僅僅是王海峰一個人,更是眾多與他同一批經(jīng)歷這樣歷史變遷學者們的默默付出,“后浪”們前赴后繼的努力,更是技術篤信者用盡青春,最 終抵達的工業(yè)革命序幕。
然而,這樣的三十年,只是一個中國AI的一個開始,正如李生教授所說:
現(xiàn)在中國AI需要做的,就是消除一些短視行為,不盲目沉迷于一時 的收益,扎扎實實以科學的態(tài)度做科學的工作。
在追求科學與真理的光明坦途上,中國AI還會走過無數(shù)個30年。
參考:
《AI已來:讓中國AI走向世界的王海峰》
- 商湯林達華萬字長文回答AGI:4層破壁,3大挑戰(zhàn)2025-08-12
- 商湯多模態(tài)大模型賦能鐵路勘察設計,讓70年經(jīng)驗“活”起來2025-08-13
- 以“具身智能基座”為核,睿爾曼攜全產(chǎn)品矩陣及新品亮相2025 WRC2025-08-11
- 哇塞,今天北京被機器人人人人人塞滿了!2025-08-08