商湯聯(lián)合創(chuàng)始人楊帆:人工智能產(chǎn)業(yè)正在面臨一個“幸福的煩惱” | MEET2022
AI算法正在從“手工作坊”轉(zhuǎn)變?yōu)椤凹辛慨a(chǎn)”
編輯部 整理自 MEET 2022
量子位 報道 | 公眾號 QbitAI
現(xiàn)在,人工智能已經(jīng)以各種方式融入了我們的生活中。
但隨著被解決的問題逐漸增多,人工智能也開始逐步走進(jìn)深水區(qū),面臨更加復(fù)雜的場景和需求。
那么,當(dāng)前的人工智能算法到底走到了什么階段?
今天技術(shù)的創(chuàng)新和創(chuàng)造越來越多的有點像工業(yè)化流水線,我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個環(huán)節(jié)整合打通,并且在這個過程中通過數(shù)據(jù)的輸入,算力的支撐,持續(xù)地規(guī)?;厣a(chǎn)技術(shù)創(chuàng)新的結(jié)果。
站在MEET 2022智能未來大會的現(xiàn)場,商湯科技的聯(lián)合創(chuàng)始人兼副總裁楊帆這樣解釋道:
技術(shù)創(chuàng)新在未來會走向一個更加通用、智能、低成本、高效的過程,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步。
我們越來越需要通用基礎(chǔ)設(shè)施,以此為將來更大、更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù)。

那么,人工智能產(chǎn)業(yè)的下一個階段又是什么?
現(xiàn)階段還面臨著怎樣的挑戰(zhàn)和趨勢?
AI業(yè)界又該采取什么樣的措施來響應(yīng)這樣的趨勢?
……
為了完整展現(xiàn)楊帆關(guān)于上述問題的答案和思考,在不改變原意的基礎(chǔ)上,量子位對他的演講內(nèi)容進(jìn)行了編輯整理。希望能夠給你帶來更多的啟發(fā)與思考。
關(guān)于MEET 智能未來大會:MEET大會是由量子位主辦的智能科技領(lǐng)域頂級商業(yè)峰會,致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。MEET2022采取線上參會形式,20余家直播平臺和渠道轉(zhuǎn)播大會直播,200萬行業(yè)用戶線上參會。除量子位微信、頭條號、知乎、微博等全媒體矩陣外,新華社、鳳凰科技、騰訊科技、澎湃新聞等數(shù)十家主流媒體紛紛報道大會及相關(guān)內(nèi)容,線上曝光量累計超過2000萬。
要點
- 人工智能產(chǎn)業(yè)時的最大價值不是去形成某一個閉環(huán)的產(chǎn)業(yè)、特定的消費行業(yè)、或者說某一個特定的生產(chǎn)型行業(yè),而是說本身就是類似于催化劑一樣的形式。
- 我們越來越需要通用基礎(chǔ)設(shè)施,以此為將來更大、更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù)。
- 相比于之前算法比較依賴于科學(xué)家個人,在過去五年,在我們對人工智能產(chǎn)業(yè)的逐步熟悉的今天,人工智能是對于架構(gòu)、算力、數(shù)據(jù)這些外化型要素強(qiáng)依賴的一種技術(shù)。由此會看到今天技術(shù)的創(chuàng)新和創(chuàng)造越來越多的有點像工業(yè)化流水線,我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個環(huán)節(jié)整合打通,并且在這個過程中通過數(shù)據(jù)的輸入,算力的支撐,持續(xù)地規(guī)?;厣a(chǎn)技術(shù)創(chuàng)新的結(jié)果。
- 技術(shù)創(chuàng)新在未來會走向一個更加通用、智能、低成本、高效的過程,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步
- 在人工智能時代系統(tǒng)第二重要,更重要的是算法本身。
- 把模型算法想象成樂高積木塊,我們提供更多基礎(chǔ)的積木塊,支撐產(chǎn)業(yè)內(nèi)的同仁一起用它打造更多更有價值的模型結(jié)果。
(以下為商湯科技聯(lián)合創(chuàng)始人兼副總裁楊帆演講全文)
人工智能逐步走入深水區(qū)
感謝量子位的邀請,今天來跟大家聊一聊商湯最近在做的一些事情。
量子位今天的主題特別好,“因為看見所以相信”,而且我覺得這話反過來說也挺有道理,“因為相信所以看見”,都很有味道。
所以,今天在這里想跟大家分享一下,在商湯最近兩年的人工智能產(chǎn)業(yè)發(fā)展過程中,我們都看見了什么,以及我們相信什么。
從2015年、2016年以來,過去的六七年時間里,人工智能產(chǎn)業(yè)或者說技術(shù)對于各個行業(yè)賦能的落地,在中國取得了非常大的進(jìn)展,而且這個進(jìn)展可以說領(lǐng)先于全世界,這絕非幸之,背后的原因非常多。

其中最重要的一個就是,當(dāng)我們?nèi)タ慈斯ぶ悄艿漠a(chǎn)業(yè)時,它最大的價值不是自己去形成某一個閉環(huán)的產(chǎn)業(yè)、某一個特定的消費行業(yè)、或者說某一個特定的生產(chǎn)型行業(yè),而是說本身就是類似于催化劑一樣的形式。
通過這種技術(shù)的創(chuàng)新能夠給我們整個國家經(jīng)濟(jì)、各個產(chǎn)業(yè)提供一種效率的提升、新場景的挖掘和新的價值。
在2017年發(fā)的人工智能的白皮書中講到:到2030年,中國人工智能核心產(chǎn)業(yè)規(guī)模將是一萬億,帶動上下游相關(guān)產(chǎn)業(yè)規(guī)模十萬億,最有價值的是十倍的杠桿,這也是我們?nèi)タ碅I產(chǎn)業(yè)最大的價值。
最近一兩年我跟很多朋友聊,大家也在問一個問題,就是人工智能似乎在逐步走入深水區(qū),我們是不是即將面臨越來越多更加復(fù)雜化的問題。
其實,雖然說今天AI已經(jīng)能夠為我們提供非常多的產(chǎn)品和服務(wù),但在我們看來還有更多的細(xì)分場景的剛需大量存在,且在今天并不能被滿足。
隨便舉幾個例子,比如今天的高鐵鐵路的車輛設(shè)備的臨檢,需要在極短時間內(nèi)對于車輛設(shè)備的各個環(huán)節(jié)進(jìn)行快速的檢查,看是否存在安全的隱患。
這樣的需求目前就滿足得不夠好,因為它需要有大量的問題被定義,而且要在一個有限的成本下被解決。

還有最近做得比較多的城市智慧化管理,怎么樣才能針對一個城市的多樣化的管理需求提供這種綜合性的能力?
比如,我們今天做一個城市管理,其需求可能是了解整個城市有沒有自行車亂停亂放、井蓋的丟失、燈箱的損壞、乃至于糞車的偷排,這些數(shù)量眾多的細(xì)碎需求。
需求側(cè)的兩個最大挑戰(zhàn)
所以,我們覺得今天工智能產(chǎn)業(yè)或者商業(yè)面臨最大的挑戰(zhàn)有兩個:
第一個是幸福的煩惱,幸福在哪里?剛需大量存在,我們會面臨大量碎片化場景和多樣化場景。
第二個問題是與此同時,我們提供這樣的技術(shù)創(chuàng)新的成本,包括邊際成本非常高,這也造成了今天AI產(chǎn)業(yè)進(jìn)一步發(fā)展面臨的供需匹配失調(diào)的問題。
我們先講第一個問題,場景碎片化。
一張簡單照片,中間可以被人類所理解和感知的信息量非常大。
一個人每天平均接觸六百個物品,每接觸三個物品定義成動作的話,有三千多萬種組合等待著我們定義。
我們再看真實世界,有句話叫“長尾是無處不在的”,各種行業(yè),各種場景下對于技術(shù)需求是非常細(xì)分而多樣的,這是未來五年十年會面臨的關(guān)鍵產(chǎn)業(yè)性問題。

另一個問題,就是今天的技術(shù)創(chuàng)新的成本仍然非常高。
數(shù)據(jù)獲取成本非常高,標(biāo)注成本非常高,處理成本也非常高。
舉個例子,有客戶需求說:我這里有一條河,希望你們能幫我在有人有時候掉河里去的時候自動檢測。
但面臨的第一件事情就是正樣本數(shù)據(jù)怎么收集,找一些人天天往河里跳嗎?不現(xiàn)實。
同樣,我們也要看到今天的技術(shù)進(jìn)步對于海量數(shù)據(jù)的使用。人工智能在過去五年的發(fā)展中,單一模型的訓(xùn)練所需要的算力成本大了三十萬倍,這就是非常大的資源性的成本。
所以我們在需求側(cè)看到兩個非常大的挑戰(zhàn),第一是場景多樣化和碎片化,第二個就是今天去解決碎片化場景的成本太高。
技術(shù)供給側(cè)和數(shù)據(jù)上的變化
再看技術(shù)供給側(cè)的進(jìn)步。
過去五年中人工智能的創(chuàng)新,最原始的創(chuàng)造周期在大大縮短。
和五年前比起來,當(dāng)我們今天研發(fā)一個同等目的的模型時,所需要的不論是人數(shù)還是需要投入的時間都在大大縮短,伴隨我們對于市場進(jìn)一步滲透的提高,這個時間將變得更短。
在今天,我們?nèi)匀徽J(rèn)為算力會成為人工智能產(chǎn)業(yè)向下發(fā)展的非常重要的基礎(chǔ)性能力——科研的演化方向是推動大模型的建設(shè),而大模型首先需要更大的算力支撐。
今天海量的產(chǎn)業(yè)應(yīng)用,對于算力提出了非常高的要求。
我們再來看看第三個要素:數(shù)據(jù)。數(shù)據(jù)是這個產(chǎn)業(yè)在未來五年會發(fā)生最大變化的地方。
當(dāng)我們的應(yīng)用場景深入到各個行業(yè)中間時,一方面,我們對于數(shù)據(jù)的隱私和安全越來越重視,行業(yè)內(nèi)會有很多新的技術(shù)和方式被提出來,并應(yīng)用到產(chǎn)業(yè)中。
另一方面,如果說未來人工智能注定是這樣對于數(shù)據(jù)有大量消化和使用的產(chǎn)業(yè)的話,對于數(shù)據(jù)的權(quán)屬的界定、數(shù)據(jù)的所有權(quán)、使用權(quán)、結(jié)果共享這些在我們今天都沒有得到足夠清晰定義的問題,就有賴于我們整個產(chǎn)業(yè)的同仁一起,在未來的時間中共同探索。
算法經(jīng)歷的三個階段
剛才講到的一些我們看到的產(chǎn)業(yè)發(fā)展的趨勢中,有需求側(cè)趨勢,有供給側(cè)趨勢,這些趨勢會為產(chǎn)業(yè)帶來什么樣的變化呢?
我個人觀點是,會看到兩個重要變化。
首先,我們越來越需要通用基礎(chǔ)設(shè)施,以此為將來更廣范圍內(nèi)的人工智能產(chǎn)業(yè)創(chuàng)新提供支撐和服務(wù),產(chǎn)業(yè)鏈走到今天這種分化的狀態(tài)也需要更細(xì)力度的分工。

另一方面,技術(shù)創(chuàng)新、產(chǎn)業(yè)創(chuàng)新、應(yīng)用創(chuàng)新也越來越需要跨組織的聯(lián)合與協(xié)作,這樣的協(xié)作模式對于過去20年互聯(lián)網(wǎng)高速發(fā)展,甚至更早的產(chǎn)業(yè)發(fā)展中的組織形態(tài),協(xié)作模式都會提出前所未有的新的變化、挑戰(zhàn)和機(jī)會。
我這里重點講一下第一件事,也就是人工智能通用技術(shù)設(shè)施。
商湯一直是做算法的,在我們自己內(nèi)部來看,做算法經(jīng)歷了三個時代:
第一個時代,在某種意義上像手工業(yè),科學(xué)家其實是一種勞動力,就跟一千兩年前木匠或者鐵匠一樣,算法非常依賴于這個科學(xué)家的聰明才智和他的能力。
這樣情況下如果把它類比成工業(yè)化的話,某種意義上是作坊式的研發(fā),其結(jié)果實際上不可知,而且依賴于科學(xué)家個人的水平。
第二個時代,在過去五年,隨著我們對人工智能產(chǎn)業(yè)的逐步熟悉,人工智能開始成為對于架構(gòu)、算力、數(shù)據(jù)這些外化型要素強(qiáng)依賴的一種技術(shù)。
今天技術(shù)的創(chuàng)新和創(chuàng)造越來越像工業(yè)化流水線,我們能夠用更多系統(tǒng)把算法創(chuàng)造的各個環(huán)節(jié)整合打通,并且在這個過程中通過數(shù)據(jù)的輸入,算力的支撐持續(xù)地,規(guī)?;厣a(chǎn)技術(shù)創(chuàng)新的結(jié)果。
下一個階段是什么呢?在我們看來,就是有了流水線,進(jìn)入工業(yè)革命,走到今天的工業(yè)4.0。
這是什么概念?整個生產(chǎn)線流水線更加自動化、智能化。
換句話說,我們認(rèn)為技術(shù)創(chuàng)新在未來會走向一個更加通用、智能、低成本、高效的方向,技術(shù)創(chuàng)新本身的模式在持續(xù)演化和進(jìn)步,中間涉及到很多技術(shù)問題,整體上是這樣的趨勢。
如何響應(yīng)這樣的趨勢
如何響應(yīng)這樣的趨勢呢?
商湯給出的觀點是,首先,我們就去用這種所謂的人工智能的通用基礎(chǔ)設(shè)施——我們自己的版本叫SenseCore。
通過這些方案,把從底層基礎(chǔ)設(shè)施到硬件、軟件、上游應(yīng)用,整個端到端系統(tǒng)化模式,或者說從人工智能的技術(shù)創(chuàng)新到應(yīng)用創(chuàng)新的各個環(huán)節(jié)都進(jìn)行更加標(biāo)準(zhǔn)化的定義,以及更加有機(jī)的組合。
其次,在這個過程中,對于整個平臺的通用性、開放性,以及相互之間連接應(yīng)該給出更好的標(biāo)準(zhǔn)和支撐,用它支撐我們在更加上層的百花齊放的應(yīng)用和創(chuàng)新的開發(fā)。
當(dāng)然,這種平臺的組合也會進(jìn)一步帶來更低的成本和更高的效率。
而商湯正是在去年年初的時候推動了上海重要新基建的項目,構(gòu)建了一個商湯內(nèi)部最大的智算中心(AIDC)。

這一設(shè)施可達(dá)到3740P FLOPS的算力,預(yù)計明年初正式投入運營。
我們以AIDC作為基礎(chǔ)底座,用它支撐未來低成本、高效率的更好的技術(shù)創(chuàng)新和創(chuàng)造。
這一設(shè)施有非常多優(yōu)勢,包括大規(guī)模彈性算力、更低的成本和更高效的使用,并且,當(dāng)端到端進(jìn)行整合的時候,也能帶來更高的安全性和更低的網(wǎng)絡(luò)時延,給上面的核心軟件系統(tǒng)提供更好的支撐。
此外,商湯也有自研的人工智能的訓(xùn)練引擎,用以支撐工業(yè)化大規(guī)模超大模型生產(chǎn)。

同時,我們也關(guān)注如何才在整個AI的模型生產(chǎn)過程中,通過系統(tǒng)的方式把更多的數(shù)據(jù),更大結(jié)構(gòu)的網(wǎng)絡(luò)整合起來,讓算力資源得到更好的規(guī)模化應(yīng)用。
其實,如果從一個系統(tǒng)來看,光有訓(xùn)練能力遠(yuǎn)遠(yuǎn)不夠。因為訓(xùn)練出來的算法模型離真正來到應(yīng)用側(cè),可以被高效部署還有很長距離。
而我們的平臺兼容業(yè)內(nèi)典型主流的各類開源平臺,通過開放架構(gòu)給用戶提供更好的支撐,用大大小小的功能化組件提供服務(wù)支撐。
人工智能時代算法最重要
我個人認(rèn)為,在人工智能時代系統(tǒng)第二重要,更重要的是算法本身。我們應(yīng)該通過算法去實現(xiàn)上面提到的大量多樣的碎片化的、細(xì)分的技術(shù)創(chuàng)造。
用什么方式去推動技術(shù)創(chuàng)造呢?
把模型算法想象成樂高積木塊,我們提供更多基礎(chǔ)的積木塊,支撐產(chǎn)業(yè)內(nèi)的同仁一起用它打造更多更有價值的模型結(jié)果。
那么,用了這樣一整套平臺體系的我們今天在做什么?
其實人工智能大裝置一直在持續(xù)迭代和進(jìn)步,商湯的幾個主要業(yè)務(wù)方向上的大量應(yīng)用和技術(shù)創(chuàng)新都來自于我們?nèi)斯ぶ悄艽笱b置的支撐。
下一步,我們希望對當(dāng)前整個產(chǎn)業(yè)進(jìn)行更大分化。我們相信,當(dāng)深入到場景挖掘出更多用戶的細(xì)分需求時,這種平臺化、規(guī)?;业统杀?、高效的工具體系,實際上會讓整個產(chǎn)業(yè)技術(shù)創(chuàng)新走的更快。
舉個例子,如果用這樣的平臺去跟某些做特定類型研究的科研機(jī)構(gòu)、特定行業(yè)的科研技術(shù)平臺、行業(yè)頭部企業(yè)合作的話,就能夠推動持續(xù)的發(fā)展和創(chuàng)新。
我們希望通過這樣一整套的技術(shù)底座和平臺體系,以及整個產(chǎn)業(yè)生態(tài)中的開放合作,持續(xù)地加速我們創(chuàng)新的過程,降低創(chuàng)新的成本,解決我在一開始講到的人工智能產(chǎn)業(yè)的、我們看見的、也是我們相信的未來關(guān)鍵的挑戰(zhàn)。

我今天的分享就到這里,謝謝。
- 有道智能學(xué)習(xí)燈發(fā)布,通過“桌面學(xué)習(xí)分析引擎”實現(xiàn)全球最快指尖查詞2022-04-08
- 科學(xué)證明:狗勾真的懂你有多累,聽到聲音0.25秒后就知道你是誰,對人比對狗更親近2022-04-14
- 在M1芯片上跑原生Linux:編譯速度比macOS還快40%2022-04-05
- 小學(xué)生們在B站講算法,網(wǎng)友:我只會阿巴阿巴2022-03-28