這一屆年輕人,開(kāi)始懷疑AI只是賣(mài)貨套路了
包括AI在內(nèi)的一切技術(shù),最終也將指向于人、服務(wù)于人。
蕭簫 發(fā)自 凹非寺
量子位 報(bào)道 | 公眾號(hào) QbitAI
導(dǎo)語(yǔ):今天(4月26日),是世界知識(shí)產(chǎn)權(quán)日。據(jù)清華AI研究院等統(tǒng)計(jì),我國(guó)AI專(zhuān)利申請(qǐng)量登頂全球第一,其中相當(dāng)一部分已經(jīng)落地應(yīng)用。
我朋友,知春路“高圓圓”,最近懷疑AI是一場(chǎng)營(yíng)銷(xiāo)騙局。
“AI過(guò)去兩年一度熱得發(fā)燙,萬(wàn)事萬(wàn)物皆可AI,比如手機(jī)的第一賣(mài)點(diǎn)也都是AI……然后呢?”
她舉著自己的手機(jī),說(shuō)很少有鋪天蓋地的AI標(biāo)榜和宣傳,但從大學(xué)以來(lái),就是換機(jī)首選。
我一看,是OPPO。
我回答她,你錯(cuò)了,OPPO只是說(shuō)得不多。
OPPO不重視AI嗎?
當(dāng)然不是。
根據(jù)公開(kāi)資料,OPPO的成名絕技——自拍、攝影等功能,背后都有AI技術(shù)的影子。
很多OPPO的忠實(shí)用戶(hù),可能很享受OPPO的影像系統(tǒng)帶來(lái)的效用。
卻往往會(huì)忽略,背后發(fā)揮作用的“感知人像”和“畫(huà)質(zhì)增強(qiáng)”兩個(gè)引擎,都是AI驅(qū)動(dòng)。
感知人像引擎,負(fù)責(zé)對(duì)拍攝時(shí)的人像區(qū)域進(jìn)行優(yōu)化,包括AI人臉關(guān)鍵點(diǎn)檢測(cè)、AI超清人像(暗景/長(zhǎng)焦拍攝)、OFL膚質(zhì)優(yōu)化、人臉畸變矯正四大項(xiàng)技術(shù)。
畫(huà)質(zhì)增強(qiáng)引擎,則包含多幀HDR等算法,保證用戶(hù)在各種場(chǎng)景下拍出滿(mǎn)意的視頻及照片。
而且,像人臉關(guān)鍵點(diǎn)檢測(cè)、超分辨率、語(yǔ)義分割、自動(dòng)補(bǔ)幀這些基礎(chǔ)AI技術(shù),OPPO的自研算法已經(jīng)都在CVPR等AI頂會(huì)、以及各種AI視覺(jué)榜單中嶄露頭角。
△ 獨(dú)創(chuàng)的超分算法,奪得CVPR 2020榜一
而且其中的不少AI技術(shù),是有據(jù)可查的專(zhuān)利——
例如,“人臉識(shí)別方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)”中,基于參數(shù)化人臉模型的實(shí)時(shí)3D稠密關(guān)鍵點(diǎn)檢測(cè)與3D人臉網(wǎng)格重建。
針對(duì)手機(jī)端使用,OPPO自研了輕量型的人臉關(guān)鍵點(diǎn)檢測(cè)AI模型。除了關(guān)鍵點(diǎn)信息以外,這一AI模型訓(xùn)練時(shí),還加入了關(guān)鍵點(diǎn)可見(jiàn)性、人臉角度判斷等輔助信息。
在WFLW人臉關(guān)鍵點(diǎn)檢測(cè)數(shù)據(jù)集上,NME(Normalized Mean Error)為實(shí)現(xiàn)了4.74%的檢測(cè)精度誤差,且能以100+fps的幀率在移動(dòng)平臺(tái)上運(yùn)行,解鎖手機(jī)安全又毫不費(fèi)力。再例如,針對(duì)由攝像頭硬件引起的人臉拍照變形,OPPO研發(fā)的“一種局部畸變的校正方法及移動(dòng)終端和相關(guān)介質(zhì)產(chǎn)品”專(zhuān)利。
隨著硬件技術(shù)的提升,目前的主流手機(jī)攝像頭,視場(chǎng)角(fov,field of view)已經(jīng)達(dá)到了80°,超廣角攝像頭更是達(dá)到了120°,這意味著在拍攝人像時(shí),不可避免會(huì)出現(xiàn)人臉畸變(50°以?xún)?nèi)才能避免)。
為了讓你的臉不被攝像機(jī)“拽扁”,在拍照時(shí),AI會(huì)自動(dòng)生成透視投影和球極平面投影兩種照片,并“摳出”球極平面投影中正常的人臉,放進(jìn)照片中。
聽(tīng)起來(lái)很簡(jiǎn)單,但實(shí)際上,球極平面投影出來(lái)的圖像,會(huì)比正常圖像偏小。為了讓摳出來(lái)的人臉和畫(huà)面保持一致性,“P得無(wú)痕無(wú)跡”,還得在模型中加上補(bǔ)償算法。
除此之外,這一算法模型還包括人臉降噪、銳度優(yōu)化和細(xì)節(jié)提升幾個(gè)子模塊,目的就是能在暗光、變焦場(chǎng)景下也能拍出清晰的人臉效果。
上面這些,都是“感知人像引擎”中的技術(shù)專(zhuān)利。而在“畫(huà)質(zhì)增強(qiáng)引擎”中,用到的AI技術(shù)只多不少。
例如,超級(jí)防抖算法。
AI通過(guò)抓取陀螺儀、加速器和傳感器的數(shù)據(jù),自動(dòng)對(duì)運(yùn)動(dòng)軌跡、姿態(tài)和曝光進(jìn)行判斷,來(lái)區(qū)分不同的場(chǎng)景,為圖像拍攝匹配不同的防抖策略。
而對(duì)視頻拍攝來(lái)說(shuō),這一防抖算法還具有運(yùn)動(dòng)趨勢(shì)判斷的功能,可以自動(dòng)選取振幅相近的畫(huà)面組成相鄰幀,極大地降低成片的抖動(dòng)感。
又例如,將夜景和HDR算法融成“組合拳”,用于亮度調(diào)節(jié)。
亮度值(lux)低的時(shí)候,AI自動(dòng)啟用夜景算法,提升亮度;亮度值高的話(huà),就啟用HDR自動(dòng)調(diào)節(jié)算法,提升局部亮度、抑制高光。
光是實(shí)現(xiàn)這一項(xiàng)技術(shù),就涉及3個(gè)環(huán)節(jié),包括畫(huà)面整體、局部?jī)?yōu)化,以及多幀融合,以減少提高亮度帶來(lái)的時(shí)域噪聲。
沒(méi)錯(cuò),OPPO是對(duì)AI技術(shù)最重視的手機(jī)廠(chǎng)商——就專(zhuān)利數(shù)量而言,甚至沒(méi)有之一。
根據(jù)清華大學(xué)人工智能研究院、清華-中國(guó)工程院知識(shí)智能聯(lián)合研究中心聯(lián)合發(fā)布的《人工智能發(fā)展報(bào)告2020》,2011-2020十年間,OPPO在國(guó)內(nèi)AI專(zhuān)利申請(qǐng)數(shù)量統(tǒng)計(jì)中排名全國(guó)第三。
截至2021年3月31日,OPPO在AI領(lǐng)域的全球?qū)@暾?qǐng)超過(guò)2450件,主要布局在計(jì)算機(jī)視覺(jué)、語(yǔ)音技術(shù)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等方面。
而且對(duì)于AI等前沿技術(shù)的重視,還有進(jìn)一步加強(qiáng)之勢(shì),體現(xiàn)在公司級(jí)戰(zhàn)略上。
比如2020年11月,OPPO正式發(fā)布“3+N+X”科技躍遷戰(zhàn)略,明確將AI作為能力中心之一:
- 3大基礎(chǔ)技術(shù)能力:硬件、軟件、服務(wù)
- N個(gè)能力中心:AI、安全隱私、多媒體等
- 差(X)異化技術(shù):AR、閃充、影像、新形態(tài)等
而近年來(lái),領(lǐng)軍人才接連加盟、高精尖技術(shù)人員相繼引進(jìn),也是OPPO重視AI等技術(shù)的風(fēng)向標(biāo)之一。
所以O(shè)PPO沒(méi)有AI、不重視AI嗎?
自然不是。
但知春路“高圓圓”的感覺(jué)也并非完全不對(duì),因?yàn)镺PPO對(duì)AI的宣傳,確實(shí)相對(duì)聲勢(shì)小很多。
這與OPPO自身的風(fēng)格和選擇有關(guān)。
“AI為人”,不必過(guò)分強(qiáng)調(diào)
我們把問(wèn)題拋向OPPO副總裁、研究院院長(zhǎng)劉暢,他給出這樣的回答:
“科技公司真正的實(shí)力,不一定需要通過(guò)營(yíng)銷(xiāo)和宣傳才能體現(xiàn)。”
劉暢認(rèn)為,OPPO內(nèi)部的技術(shù)理念,也不提倡把技術(shù)掛在嘴邊,或者成為用戶(hù)認(rèn)知上的負(fù)擔(dān)。
用戶(hù)選擇你的科技產(chǎn)品,享受科技帶來(lái)的便利,但不必知曉背后復(fù)雜的原理,不必增加認(rèn)知上的負(fù)擔(dān),真正有科技力的產(chǎn)品,用戶(hù)不必“感知到”科技的存在。
OPPO把這個(gè)理念稱(chēng)為“科技為人”。
比如在AI成像在業(yè)內(nèi)宣傳熱鬧之前,OPPO用戶(hù)其實(shí)就已經(jīng)有實(shí)際體驗(yàn),他們的手機(jī)在逆光環(huán)境下也能清晰成像,他們的手機(jī)夜間拍視頻也明亮飽滿(mǎn),畫(huà)質(zhì)有保障。
但這些用戶(hù)只需要感知到效果好,而不必被告知和灌輸繁瑣的技術(shù)原理。
再比如,OPPO用戶(hù)發(fā)現(xiàn),自己的手機(jī)放置于桌面,目光所至屏幕點(diǎn)亮,目光移開(kāi)屏幕又熄。頗有王陽(yáng)明“你未看此花時(shí),此花與汝心同歸于寂”的哲學(xué)意味……在日常場(chǎng)景中也非常實(shí)用。
但這些用戶(hù)不必知道,背后涉及的AI感知和眼球追蹤等技術(shù)。
其實(shí)對(duì)于手機(jī)行業(yè)來(lái)說(shuō),新技術(shù)很多,可以加強(qiáng)自身黑科技形象的技術(shù)也有很多。
那么,評(píng)判、選擇的標(biāo)準(zhǔn)是什么?
劉暢透露,對(duì)于OPPO內(nèi)部而言,從應(yīng)用場(chǎng)景來(lái)看,技術(shù)通常會(huì)被劃分優(yōu)先級(jí)。
如相機(jī)、相冊(cè)、語(yǔ)音助手(如小布Breeno)、視頻軟件(如即錄)這些用戶(hù)經(jīng)常使用的功能,屬于頭部應(yīng)用場(chǎng)景;而對(duì)于圖片優(yōu)化、證件照拍攝等關(guān)注度略少的功能,則屬于尾部場(chǎng)景。
而從技術(shù)研究本身來(lái)看,一項(xiàng)AI技術(shù)是否值得鉆研,同樣有“前沿”或是“有用”的評(píng)判標(biāo)準(zhǔn)。
在OPPO研究院,則有著3:5:2的說(shuō)法,其中30%的投入,用來(lái)做產(chǎn)品和業(yè)務(wù)的技術(shù)轉(zhuǎn)化,將一些AI算法與場(chǎng)景結(jié)合;50%做前瞻性布局,如AR技術(shù)驅(qū)動(dòng);20%則靠天才或“瘋子”驅(qū)動(dòng)研究。
然而,無(wú)論場(chǎng)景優(yōu)先級(jí),還是“前沿”和“有用”,都并非OPPO評(píng)判技術(shù)的核心標(biāo)準(zhǔn)。
在OPPO內(nèi)部,選擇前沿技術(shù)展開(kāi)創(chuàng)新和突破,最關(guān)鍵的標(biāo)準(zhǔn)在于——給用戶(hù)帶來(lái)的價(jià)值。
而對(duì)用戶(hù)和使用效果的關(guān)注,甚至從技術(shù)立項(xiàng)和研發(fā)之初,就會(huì)成為標(biāo)準(zhǔn)。
背后的核心理念,也是CEO陳明永所強(qiáng)調(diào)的“致善式”創(chuàng)新,不做關(guān)注競(jìng)爭(zhēng)和友商的創(chuàng)新,關(guān)注用戶(hù)和用戶(hù)需求本身,遵循本分。
△OPPO創(chuàng)始人兼首席執(zhí)行官陳明永
在OPPO研究院,新技術(shù)立項(xiàng)和選擇,會(huì)有“終極使用設(shè)想”——會(huì)大致以怎樣的方式給用戶(hù)帶來(lái)怎樣的體驗(yàn)提升?
這種標(biāo)準(zhǔn)下,有些功能很小,但用戶(hù)剛需時(shí)很爽,就做。
比如OPPO手機(jī)中,有一個(gè)叫“AI證件照”的功能,使用頻次不高,但當(dāng)技術(shù)人員描繪使用設(shè)想,并論證對(duì)用戶(hù)實(shí)實(shí)在在的價(jià)值后,OPPO選擇了開(kāi)發(fā)它。
又例如,已在OPPO商店上線(xiàn)的《表情包大作戰(zhàn)》小游戲,能用AI算法同時(shí)識(shí)別多個(gè)人的表情,一起參與游戲,迅速拉近親友同事伴侶間的關(guān)系(手動(dòng)狗頭)。
所以如此理念和機(jī)制下,OPPO的用戶(hù)時(shí)有驚喜,而且忠誠(chéng)度很高。
對(duì)于科學(xué)家和技術(shù)工程師而言,這樣的理念和機(jī)制,也讓他們不斷被用戶(hù)的由衷稱(chēng)贊所激勵(lì),動(dòng)力和成就感十足。
視頻防抖、眼球追蹤、125W快充“餅干充電器”,可變色手機(jī)……一茬接一茬的創(chuàng)新能力和體驗(yàn),就這樣被驅(qū)動(dòng)產(chǎn)生。
當(dāng)然,OPPO的這種理念也并非全無(wú)劣勢(shì)。
如果技術(shù)的應(yīng)用和創(chuàng)新,總是以用戶(hù)體驗(yàn)、感知效果為導(dǎo)向,就會(huì)導(dǎo)致一個(gè)悖論:
不去使用的話(huà),就沒(méi)有機(jī)會(huì)去感知。
更直白來(lái)說(shuō),這是為什么也有玩家,把技術(shù)和科技創(chuàng)新,喊得響亮的原因。聲勢(shì)越大,用戶(hù)直觀(guān)受影響的可能性越強(qiáng),接觸并使用產(chǎn)品的可能性也就越高。反之亦然。
所以O(shè)PPO就從沒(méi)有過(guò)糾結(jié)嗎?
劉暢說(shuō),沒(méi)有。
在OPPO研究院搞創(chuàng)新會(huì)是怎樣的體驗(yàn)?
這位OPPO副總裁、研究院院長(zhǎng)說(shuō),因?yàn)镺PPO的理念就是如此,如果公司上上下下都是這樣,就不會(huì)有糾結(jié)。
所以O(shè)PPO研究院雖然成立不算早,但理念和思路格外清晰——
依然要以用戶(hù)價(jià)值為導(dǎo)向、以人為本。
與貝爾、施樂(lè)等側(cè)重于理論、基礎(chǔ)的研究院不同的是,OPPO從成立伊始,聚焦點(diǎn)就是應(yīng)用性研究。
相比于施樂(lè)所發(fā)明的圖形界面、手機(jī)、Pad、電池等產(chǎn)品本身,OPPO看中的是這些產(chǎn)品背后的技術(shù)價(jià)值,即如何才能更好地應(yīng)用它。
也就是說(shuō),OPPO研究的并不止是算法本身,而是算法的體驗(yàn)度,包括優(yōu)化應(yīng)用時(shí)的響應(yīng)時(shí)間、與硬件結(jié)合、數(shù)據(jù)選取、精確度等等指標(biāo)。
這樣在迭代、加速一項(xiàng)AI技術(shù)的同時(shí),也能反過(guò)來(lái)證明一些理論研究、從而加速技術(shù)創(chuàng)新。
并且因?yàn)樯硖幋蟊娤M(fèi)電子產(chǎn)業(yè),用戶(hù)的反饋實(shí)際也會(huì)快速而直接,對(duì)于科研和技術(shù)人員而言,堪稱(chēng)立竿見(jiàn)影。
這讓科研和技術(shù)容易獲得成就感。
而且作為一家創(chuàng)辦于2004年的公司,OPPO其實(shí)經(jīng)歷過(guò)不少新技術(shù)驅(qū)動(dòng)的新產(chǎn)品創(chuàng)新周期,整個(gè)市場(chǎng)聲量會(huì)變得很大,多音復(fù)義,眾聲喧嘩……希望最快速影響更多的用戶(hù)。
但跨過(guò)最初的“風(fēng)口”之后,留存的本質(zhì),依舊是產(chǎn)品體驗(yàn)。
所以目光拉長(zhǎng)、時(shí)間維度拉長(zhǎng),產(chǎn)品的競(jìng)爭(zhēng)力依然在于體驗(yàn),而不是時(shí)髦技術(shù)的營(yíng)銷(xiāo)和宣傳。
劉暢說(shuō),做時(shí)間的朋友就不會(huì)慌。
當(dāng)然,這或許還跟AI等技術(shù)的內(nèi)在特性息息相關(guān)。
從AI的發(fā)展來(lái)看,作為基礎(chǔ)性技術(shù),AI正在被應(yīng)用到更加基礎(chǔ)的領(lǐng)域中,如聲光水電,不知不覺(jué)中滲透進(jìn)我們的生活。
我們現(xiàn)在無(wú)時(shí)不刻離不開(kāi)電,但我們不再?gòu)?qiáng)調(diào)“電”本身如何如何神奇。
AI也是,甚至一切技術(shù)皆如是,最終還是指向于人,服務(wù)于人。
所以O(shè)PPO基于“AI為人”展開(kāi)的一切,看起來(lái)是一條更難的路,實(shí)際是更為本質(zhì)的路:
當(dāng)智能產(chǎn)品最終趨于同質(zhì)化時(shí),技術(shù)終將為解決剛需而服務(wù)。
參考鏈接:
[1]http://www.cdtc.org.cn/a/tongzhigonggao_hongseziti_/2020/1225/1156.html
[2]https://www.aminer.cn/research_report/6008402fe8a87f775ad224d8