商湯聯(lián)合創(chuàng)始人楊帆:人工智能產(chǎn)業(yè)正在面臨一個(gè)“幸福的煩惱” | MEET2022
AI算法正在從“手工作坊”轉(zhuǎn)變?yōu)椤凹辛慨a(chǎn)”
編輯部 整理自 MEET 2022
量子位 報(bào)道 | 公眾號(hào) QbitAI
現(xiàn)在,人工智能已經(jīng)以各種方式融入了我們的生活中。
但隨著被解決的問(wèn)題逐漸增多,人工智能也開(kāi)始逐步走進(jìn)深水區(qū),面臨更加復(fù)雜的場(chǎng)景和需求。
那么,當(dāng)前的人工智能算法到底走到了什么階段?
今天技術(shù)的創(chuàng)新和創(chuàng)造越來(lái)越多的有點(diǎn)像工業(yè)化流水線(xiàn),我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個(gè)環(huán)節(jié)整合打通,并且在這個(gè)過(guò)程中通過(guò)數(shù)據(jù)的輸入,算力的支撐,持續(xù)地規(guī)模化地生產(chǎn)技術(shù)創(chuàng)新的結(jié)果。
站在MEET 2022智能未來(lái)大會(huì)的現(xiàn)場(chǎng),商湯科技的聯(lián)合創(chuàng)始人兼副總裁楊帆這樣解釋道:
技術(shù)創(chuàng)新在未來(lái)會(huì)走向一個(gè)更加通用、智能、低成本、高效的過(guò)程,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步。
我們?cè)絹?lái)越需要通用基礎(chǔ)設(shè)施,以此為將來(lái)更大、更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù)。

那么,人工智能產(chǎn)業(yè)的下一個(gè)階段又是什么?
現(xiàn)階段還面臨著怎樣的挑戰(zhàn)和趨勢(shì)?
AI業(yè)界又該采取什么樣的措施來(lái)響應(yīng)這樣的趨勢(shì)?
……
為了完整展現(xiàn)楊帆關(guān)于上述問(wèn)題的答案和思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)他的演講內(nèi)容進(jìn)行了編輯整理。希望能夠給你帶來(lái)更多的啟發(fā)與思考。
關(guān)于MEET 智能未來(lái)大會(huì):MEET大會(huì)是由量子位主辦的智能科技領(lǐng)域頂級(jí)商業(yè)峰會(huì),致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。MEET2022采取線(xiàn)上參會(huì)形式,20余家直播平臺(tái)和渠道轉(zhuǎn)播大會(huì)直播,200萬(wàn)行業(yè)用戶(hù)線(xiàn)上參會(huì)。除量子位微信、頭條號(hào)、知乎、微博等全媒體矩陣外,新華社、鳳凰科技、騰訊科技、澎湃新聞等數(shù)十家主流媒體紛紛報(bào)道大會(huì)及相關(guān)內(nèi)容,線(xiàn)上曝光量累計(jì)超過(guò)2000萬(wàn)。
要點(diǎn)
- 人工智能產(chǎn)業(yè)時(shí)的最大價(jià)值不是去形成某一個(gè)閉環(huán)的產(chǎn)業(yè)、特定的消費(fèi)行業(yè)、或者說(shuō)某一個(gè)特定的生產(chǎn)型行業(yè),而是說(shuō)本身就是類(lèi)似于催化劑一樣的形式。
- 我們?cè)絹?lái)越需要通用基礎(chǔ)設(shè)施,以此為將來(lái)更大、更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù)。
- 相比于之前算法比較依賴(lài)于科學(xué)家個(gè)人,在過(guò)去五年,在我們對(duì)人工智能產(chǎn)業(yè)的逐步熟悉的今天,人工智能是對(duì)于架構(gòu)、算力、數(shù)據(jù)這些外化型要素強(qiáng)依賴(lài)的一種技術(shù)。由此會(huì)看到今天技術(shù)的創(chuàng)新和創(chuàng)造越來(lái)越多的有點(diǎn)像工業(yè)化流水線(xiàn),我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個(gè)環(huán)節(jié)整合打通,并且在這個(gè)過(guò)程中通過(guò)數(shù)據(jù)的輸入,算力的支撐,持續(xù)地規(guī)?;厣a(chǎn)技術(shù)創(chuàng)新的結(jié)果。
- 技術(shù)創(chuàng)新在未來(lái)會(huì)走向一個(gè)更加通用、智能、低成本、高效的過(guò)程,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步
- 在人工智能時(shí)代系統(tǒng)第二重要,更重要的是算法本身。
- 把模型算法想象成樂(lè)高積木塊,我們提供更多基礎(chǔ)的積木塊,支撐產(chǎn)業(yè)內(nèi)的同仁一起用它打造更多更有價(jià)值的模型結(jié)果。
(以下為商湯科技聯(lián)合創(chuàng)始人兼副總裁楊帆演講全文)
人工智能逐步走入深水區(qū)
感謝量子位的邀請(qǐng),今天來(lái)跟大家聊一聊商湯最近在做的一些事情。
量子位今天的主題特別好,“因?yàn)榭匆?jiàn)所以相信”,而且我覺(jué)得這話(huà)反過(guò)來(lái)說(shuō)也挺有道理,“因?yàn)橄嘈潘钥匆?jiàn)”,都很有味道。
所以,今天在這里想跟大家分享一下,在商湯最近兩年的人工智能產(chǎn)業(yè)發(fā)展過(guò)程中,我們都看見(jiàn)了什么,以及我們相信什么。
從2015年、2016年以來(lái),過(guò)去的六七年時(shí)間里,人工智能產(chǎn)業(yè)或者說(shuō)技術(shù)對(duì)于各個(gè)行業(yè)賦能的落地,在中國(guó)取得了非常大的進(jìn)展,而且這個(gè)進(jìn)展可以說(shuō)領(lǐng)先于全世界,這絕非幸之,背后的原因非常多。

其中最重要的一個(gè)就是,當(dāng)我們?nèi)タ慈斯ぶ悄艿漠a(chǎn)業(yè)時(shí),它最大的價(jià)值不是自己去形成某一個(gè)閉環(huán)的產(chǎn)業(yè)、某一個(gè)特定的消費(fèi)行業(yè)、或者說(shuō)某一個(gè)特定的生產(chǎn)型行業(yè),而是說(shuō)本身就是類(lèi)似于催化劑一樣的形式。
通過(guò)這種技術(shù)的創(chuàng)新能夠給我們整個(gè)國(guó)家經(jīng)濟(jì)、各個(gè)產(chǎn)業(yè)提供一種效率的提升、新場(chǎng)景的挖掘和新的價(jià)值。
在2017年發(fā)的人工智能的白皮書(shū)中講到:到2030年,中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模將是一萬(wàn)億,帶動(dòng)上下游相關(guān)產(chǎn)業(yè)規(guī)模十萬(wàn)億,最有價(jià)值的是十倍的杠桿,這也是我們?nèi)タ碅I產(chǎn)業(yè)最大的價(jià)值。
最近一兩年我跟很多朋友聊,大家也在問(wèn)一個(gè)問(wèn)題,就是人工智能似乎在逐步走入深水區(qū),我們是不是即將面臨越來(lái)越多更加復(fù)雜化的問(wèn)題。
其實(shí),雖然說(shuō)今天AI已經(jīng)能夠?yàn)槲覀兲峁┓浅6嗟漠a(chǎn)品和服務(wù),但在我們看來(lái)還有更多的細(xì)分場(chǎng)景的剛需大量存在,且在今天并不能被滿(mǎn)足。
隨便舉幾個(gè)例子,比如今天的高鐵鐵路的車(chē)輛設(shè)備的臨檢,需要在極短時(shí)間內(nèi)對(duì)于車(chē)輛設(shè)備的各個(gè)環(huán)節(jié)進(jìn)行快速的檢查,看是否存在安全的隱患。
這樣的需求目前就滿(mǎn)足得不夠好,因?yàn)樗枰写罅康膯?wèn)題被定義,而且要在一個(gè)有限的成本下被解決。

還有最近做得比較多的城市智慧化管理,怎么樣才能針對(duì)一個(gè)城市的多樣化的管理需求提供這種綜合性的能力?
比如,我們今天做一個(gè)城市管理,其需求可能是了解整個(gè)城市有沒(méi)有自行車(chē)亂停亂放、井蓋的丟失、燈箱的損壞、乃至于糞車(chē)的偷排,這些數(shù)量眾多的細(xì)碎需求。
需求側(cè)的兩個(gè)最大挑戰(zhàn)
所以,我們覺(jué)得今天工智能產(chǎn)業(yè)或者商業(yè)面臨最大的挑戰(zhàn)有兩個(gè):
第一個(gè)是幸福的煩惱,幸福在哪里?剛需大量存在,我們會(huì)面臨大量碎片化場(chǎng)景和多樣化場(chǎng)景。
第二個(gè)問(wèn)題是與此同時(shí),我們提供這樣的技術(shù)創(chuàng)新的成本,包括邊際成本非常高,這也造成了今天AI產(chǎn)業(yè)進(jìn)一步發(fā)展面臨的供需匹配失調(diào)的問(wèn)題。
我們先講第一個(gè)問(wèn)題,場(chǎng)景碎片化。
一張簡(jiǎn)單照片,中間可以被人類(lèi)所理解和感知的信息量非常大。
一個(gè)人每天平均接觸六百個(gè)物品,每接觸三個(gè)物品定義成動(dòng)作的話(huà),有三千多萬(wàn)種組合等待著我們定義。
我們?cè)倏凑鎸?shí)世界,有句話(huà)叫“長(zhǎng)尾是無(wú)處不在的”,各種行業(yè),各種場(chǎng)景下對(duì)于技術(shù)需求是非常細(xì)分而多樣的,這是未來(lái)五年十年會(huì)面臨的關(guān)鍵產(chǎn)業(yè)性問(wèn)題。

另一個(gè)問(wèn)題,就是今天的技術(shù)創(chuàng)新的成本仍然非常高。
數(shù)據(jù)獲取成本非常高,標(biāo)注成本非常高,處理成本也非常高。
舉個(gè)例子,有客戶(hù)需求說(shuō):我這里有一條河,希望你們能幫我在有人有時(shí)候掉河里去的時(shí)候自動(dòng)檢測(cè)。
但面臨的第一件事情就是正樣本數(shù)據(jù)怎么收集,找一些人天天往河里跳嗎?不現(xiàn)實(shí)。
同樣,我們也要看到今天的技術(shù)進(jìn)步對(duì)于海量數(shù)據(jù)的使用。人工智能在過(guò)去五年的發(fā)展中,單一模型的訓(xùn)練所需要的算力成本大了三十萬(wàn)倍,這就是非常大的資源性的成本。
所以我們?cè)谛枨髠?cè)看到兩個(gè)非常大的挑戰(zhàn),第一是場(chǎng)景多樣化和碎片化,第二個(gè)就是今天去解決碎片化場(chǎng)景的成本太高。
技術(shù)供給側(cè)和數(shù)據(jù)上的變化
再看技術(shù)供給側(cè)的進(jìn)步。
過(guò)去五年中人工智能的創(chuàng)新,最原始的創(chuàng)造周期在大大縮短。
和五年前比起來(lái),當(dāng)我們今天研發(fā)一個(gè)同等目的的模型時(shí),所需要的不論是人數(shù)還是需要投入的時(shí)間都在大大縮短,伴隨我們對(duì)于市場(chǎng)進(jìn)一步滲透的提高,這個(gè)時(shí)間將變得更短。
在今天,我們?nèi)匀徽J(rèn)為算力會(huì)成為人工智能產(chǎn)業(yè)向下發(fā)展的非常重要的基礎(chǔ)性能力——科研的演化方向是推動(dòng)大模型的建設(shè),而大模型首先需要更大的算力支撐。
今天海量的產(chǎn)業(yè)應(yīng)用,對(duì)于算力提出了非常高的要求。
我們?cè)賮?lái)看看第三個(gè)要素:數(shù)據(jù)。數(shù)據(jù)是這個(gè)產(chǎn)業(yè)在未來(lái)五年會(huì)發(fā)生最大變化的地方。
當(dāng)我們的應(yīng)用場(chǎng)景深入到各個(gè)行業(yè)中間時(shí),一方面,我們對(duì)于數(shù)據(jù)的隱私和安全越來(lái)越重視,行業(yè)內(nèi)會(huì)有很多新的技術(shù)和方式被提出來(lái),并應(yīng)用到產(chǎn)業(yè)中。
另一方面,如果說(shuō)未來(lái)人工智能注定是這樣對(duì)于數(shù)據(jù)有大量消化和使用的產(chǎn)業(yè)的話(huà),對(duì)于數(shù)據(jù)的權(quán)屬的界定、數(shù)據(jù)的所有權(quán)、使用權(quán)、結(jié)果共享這些在我們今天都沒(méi)有得到足夠清晰定義的問(wèn)題,就有賴(lài)于我們整個(gè)產(chǎn)業(yè)的同仁一起,在未來(lái)的時(shí)間中共同探索。
算法經(jīng)歷的三個(gè)階段
剛才講到的一些我們看到的產(chǎn)業(yè)發(fā)展的趨勢(shì)中,有需求側(cè)趨勢(shì),有供給側(cè)趨勢(shì),這些趨勢(shì)會(huì)為產(chǎn)業(yè)帶來(lái)什么樣的變化呢?
我個(gè)人觀點(diǎn)是,會(huì)看到兩個(gè)重要變化。
首先,我們?cè)絹?lái)越需要通用基礎(chǔ)設(shè)施,以此為將來(lái)更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù),產(chǎn)業(yè)鏈走到今天這種分化的狀態(tài)也需要更細(xì)力度的分工。

另一方面,技術(shù)創(chuàng)新、產(chǎn)業(yè)創(chuàng)新、應(yīng)用創(chuàng)新也越來(lái)越需要跨組織的聯(lián)合與協(xié)作,這樣的協(xié)作模式對(duì)于過(guò)去20年互聯(lián)網(wǎng)高速發(fā)展,甚至更早的產(chǎn)業(yè)發(fā)展中的組織形態(tài),協(xié)作模式都會(huì)提出前所未有的新的變化、挑戰(zhàn)和機(jī)會(huì)。
我這里重點(diǎn)講一下第一件事,也就是人工智能通用技術(shù)設(shè)施。
商湯一直是做算法的,在我們自己內(nèi)部來(lái)看,做算法經(jīng)歷了三個(gè)時(shí)代:
第一個(gè)時(shí)代,在某種意義上像手工業(yè),科學(xué)家其實(shí)是一種勞動(dòng)力,就跟一千兩年前木匠或者鐵匠一樣,算法非常依賴(lài)于這個(gè)科學(xué)家的聰明才智和他的能力。
這樣情況下如果把它類(lèi)比成工業(yè)化的話(huà),某種意義上是作坊式的研發(fā),其結(jié)果實(shí)際上不可知,而且依賴(lài)于科學(xué)家個(gè)人的水平。
第二個(gè)時(shí)代,在過(guò)去五年,隨著我們對(duì)人工智能產(chǎn)業(yè)的逐步熟悉,人工智能開(kāi)始成為對(duì)于架構(gòu)、算力、數(shù)據(jù)這些外化型要素強(qiáng)依賴(lài)的一種技術(shù)。
今天技術(shù)的創(chuàng)新和創(chuàng)造越來(lái)越像工業(yè)化流水線(xiàn),我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個(gè)環(huán)節(jié)整合打通,并且在這個(gè)過(guò)程中通過(guò)數(shù)據(jù)的輸入,算力的支撐持續(xù)地,規(guī)?;厣a(chǎn)技術(shù)創(chuàng)新的結(jié)果。
下一個(gè)階段是什么呢?在我們看來(lái),就是有了流水線(xiàn),進(jìn)入工業(yè)革命,走到今天的工業(yè)4.0。
這是什么概念?整個(gè)生產(chǎn)線(xiàn)流水線(xiàn)更加自動(dòng)化、智能化。
換句話(huà)說(shuō),我們認(rèn)為技術(shù)創(chuàng)新在未來(lái)會(huì)走向一個(gè)更加通用、智能、低成本、高效的方向,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步,中間涉及到很多技術(shù)問(wèn)題,整體上是這樣的趨勢(shì)。
如何響應(yīng)這樣的趨勢(shì)
如何響應(yīng)這樣的趨勢(shì)呢?
商湯給出的觀點(diǎn)是,首先,我們就去用這種所謂的人工智能的通用基礎(chǔ)設(shè)施——我們自己的版本叫SenseCore。
通過(guò)這些方案,把從底層基礎(chǔ)設(shè)施到硬件、軟件、上游應(yīng)用,整個(gè)端到端系統(tǒng)化模式,或者說(shuō)從人工智能的技術(shù)創(chuàng)新到應(yīng)用創(chuàng)新的各個(gè)環(huán)節(jié)都進(jìn)行更加標(biāo)準(zhǔn)化的定義,以及更加有機(jī)的組合。
其次,在這個(gè)過(guò)程中,對(duì)于整個(gè)平臺(tái)的通用性、開(kāi)放性,以及相互之間連接應(yīng)該給出更好的標(biāo)準(zhǔn)和支撐,用它支撐我們?cè)诟由蠈拥陌倩R放的應(yīng)用和創(chuàng)新的開(kāi)發(fā)。
當(dāng)然,這種平臺(tái)的組合也會(huì)進(jìn)一步帶來(lái)更低的成本和更高的效率。
而商湯正是在去年年初的時(shí)候推動(dòng)了上海重要新基建的項(xiàng)目,構(gòu)建了一個(gè)商湯內(nèi)部最大的智算中心(AIDC)。

這一設(shè)施可達(dá)到3740P FLOPS的算力,預(yù)計(jì)明年初正式投入運(yùn)營(yíng)。
我們以AIDC作為基礎(chǔ)底座,用它支撐未來(lái)低成本、高效率的更好的技術(shù)創(chuàng)新和創(chuàng)造。
這一設(shè)施有非常多優(yōu)勢(shì),包括大規(guī)模彈性算力、更低的成本和更高效的使用,并且,當(dāng)端到端進(jìn)行整合的時(shí)候,也能帶來(lái)更高的安全性和更低的網(wǎng)絡(luò)時(shí)延,給上面的核心軟件系統(tǒng)提供更好的支撐。
此外,商湯也有自研的人工智能的訓(xùn)練引擎,用以支撐工業(yè)化大規(guī)模超大模型生產(chǎn)。

同時(shí),我們也關(guān)注如何才在整個(gè)AI的模型生產(chǎn)過(guò)程中,通過(guò)系統(tǒng)的方式把更多的數(shù)據(jù),更大結(jié)構(gòu)的網(wǎng)絡(luò)整合起來(lái),讓算力資源得到更好的規(guī)?;瘧?yīng)用。
其實(shí),如果從一個(gè)系統(tǒng)來(lái)看,光有訓(xùn)練能力遠(yuǎn)遠(yuǎn)不夠。因?yàn)橛?xùn)練出來(lái)的算法模型離真正來(lái)到應(yīng)用側(cè),可以被高效部署還有很長(zhǎng)距離。
而我們的平臺(tái)兼容業(yè)內(nèi)典型主流的各類(lèi)開(kāi)源平臺(tái),通過(guò)開(kāi)放架構(gòu)給用戶(hù)提供更好的支撐,用大大小小的功能化組件提供服務(wù)支撐。
人工智能時(shí)代算法最重要
我個(gè)人認(rèn)為,在人工智能時(shí)代系統(tǒng)第二重要,更重要的是算法本身。我們應(yīng)該通過(guò)算法去實(shí)現(xiàn)上面提到的大量多樣的碎片化的、細(xì)分的技術(shù)創(chuàng)造。
用什么方式去推動(dòng)技術(shù)創(chuàng)造呢?
把模型算法想象成樂(lè)高積木塊,我們提供更多基礎(chǔ)的積木塊,支撐產(chǎn)業(yè)內(nèi)的同仁一起用它打造更多更有價(jià)值的模型結(jié)果。
那么,用了這樣一整套平臺(tái)體系的我們今天在做什么?
其實(shí)人工智能大裝置一直在持續(xù)迭代和進(jìn)步,商湯的幾個(gè)主要業(yè)務(wù)方向上的大量應(yīng)用和技術(shù)創(chuàng)新都來(lái)自于我們?nèi)斯ぶ悄艽笱b置的支撐。
下一步,我們希望對(duì)當(dāng)前整個(gè)產(chǎn)業(yè)進(jìn)行更大分化。我們相信,當(dāng)深入到場(chǎng)景挖掘出更多用戶(hù)的細(xì)分需求時(shí),這種平臺(tái)化、規(guī)?;业统杀?、高效的工具體系,實(shí)際上會(huì)讓整個(gè)產(chǎn)業(yè)技術(shù)創(chuàng)新走的更快。
舉個(gè)例子,如果用這樣的平臺(tái)去跟某些做特定類(lèi)型研究的科研機(jī)構(gòu)、特定行業(yè)的科研技術(shù)平臺(tái)、行業(yè)頭部企業(yè)合作的話(huà),就能夠推動(dòng)持續(xù)的發(fā)展和創(chuàng)新。
我們希望通過(guò)這樣一整套的技術(shù)底座和平臺(tái)體系,以及整個(gè)產(chǎn)業(yè)生態(tài)中的開(kāi)放合作,持續(xù)地加速我們創(chuàng)新的過(guò)程,降低創(chuàng)新的成本,解決我在一開(kāi)始講到的人工智能產(chǎn)業(yè)的、我們看見(jiàn)的、也是我們相信的未來(lái)關(guān)鍵的挑戰(zhàn)。

我今天的分享就到這里,謝謝。