“真實數(shù)據(jù)+開源平臺”,這樣的算法大賽才是AI真正的演武場
“商業(yè)界和學(xué)生智慧的碰撞,一定能結(jié)出很多果實和火花?!?/p>
魚羊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
“商業(yè)界和學(xué)生智慧的碰撞,一定能結(jié)出很多果實和火花?!?/p>
國內(nèi)疫情逐漸平穩(wěn),被打亂節(jié)奏的招聘季重新成為熱議話題。
不過,突如其來的意外沖擊,還是給AI在內(nèi)的科技行業(yè)帶來了意想不到的變化。
新的趨勢何在?相關(guān)專業(yè)學(xué)生和從業(yè)者又應(yīng)該如何應(yīng)對變化?
面對這些問題,在2020騰訊廣告算法大賽的專題直播活動中,知乎大V“北冥乘海生”本尊、大數(shù)據(jù)與人工智能專家劉鵬給出了開頭的那句答案。
而他所指的“演武場”,正是騰訊廣告算法大賽。
不只是劉鵬,北京大學(xué)計算機(jī)系副主任崔斌、微眾銀行首席AI官楊強(qiáng)、騰訊公司副總裁王巨宏、騰訊廣告副總裁蔣杰以及騰訊云副總裁黃世飛等一眾大佬,都在這場直播中,就相關(guān)專業(yè)學(xué)生和技術(shù)從業(yè)者普遍關(guān)注的議題:行業(yè)趨勢、職業(yè)發(fā)展……暢談了自己的觀點(diǎn)。
后疫情時代,產(chǎn)學(xué)如何結(jié)合
突發(fā)的疫情,給整個社會生產(chǎn)生活,都帶來了非常大的影響。
對于科技行業(yè)而言,新的問題帶來了新的挑戰(zhàn),卻也帶來了前沿技術(shù)落地的新契機(jī)。
正如騰訊公司副總裁王巨宏談到的,疫情期間,像騰訊這樣的科技企業(yè),就利用起了自己的云計算、大數(shù)據(jù)、AI等能力參與抗“疫”,為復(fù)工復(fù)產(chǎn)提供技術(shù)支援。
比如健康碼。小小一個健康碼的背后,其實集結(jié)了人臉比對、OCR識別等各類要素信息核驗?zāi)芰Α?/p>
而騰訊就通過自己的云上視覺、語音、語義等AI能力,基于國家衛(wèi)健委疫情信息大數(shù)據(jù),將居民健康風(fēng)險劃分為低風(fēng)險人群、中風(fēng)險人群、高風(fēng)險人群等三類,打通健康狀態(tài)非接觸式核驗,已覆蓋22個省、60個衛(wèi)健委,接入醫(yī)療機(jī)構(gòu)近600家。
又比如對疫情期間受影響較大的中小餐飲行業(yè),騰訊廣告基于附近推產(chǎn)品推出“百萬門店成長計劃”,
借助龐大的微信流量幫助線下門店注入生意增長新活力,用12億月活用戶為門店引流,有效降低這些中小型企業(yè)的投放門檻,提升引流效果,共克時艱。對于大型企業(yè),實現(xiàn)數(shù)據(jù)精細(xì)化運(yùn)營,打通營銷閉環(huán),助力企業(yè)在商業(yè)上智慧增長。
騰訊云副總裁黃世飛提出這樣的觀點(diǎn):
后疫情時代里面,在產(chǎn)業(yè)互聯(lián)網(wǎng)中會有越來越多的產(chǎn)業(yè)跟AI平臺做結(jié)合,進(jìn)行一些業(yè)務(wù)的創(chuàng)新,降本提效。
北京大學(xué)計算機(jī)系副主任崔斌教授也指出,疫情爆發(fā)后,國家對新基建的重視程度提升,這對于人工智能產(chǎn)業(yè)的發(fā)展是一個很好的機(jī)遇。
比如人工智能平臺。作為人工智能里的“基礎(chǔ)設(shè)施”,開源開放的平臺對于人工智能研究產(chǎn)業(yè)發(fā)展起到非常重要的作用。這也是為什么國內(nèi)的科技巨頭紛紛投入這方面的工作,比如PaddlePaddle,騰訊廣告算法大賽此次提供的Angel深度學(xué)習(xí)引擎等等。
微眾銀行首席AI官楊強(qiáng)表示,在金融行業(yè)可以利用人工智能機(jī)器人進(jìn)行線上服務(wù),比如利用人臉識別、聲紋識別等技術(shù)進(jìn)行在線的身份核驗,通過對話系統(tǒng)和用戶交流;在智能營銷方面也可以利用聯(lián)邦廣告和聯(lián)邦推薦技術(shù),在保護(hù)隱私的前提下,利用多方數(shù)據(jù)進(jìn)行精準(zhǔn)營銷。
那么,面對新的機(jī)遇,應(yīng)該做什么樣的準(zhǔn)備?
自然是技術(shù)力量的不斷跟進(jìn)。
這不單單要靠產(chǎn)業(yè)界的努力,也需要學(xué)術(shù)界的智慧。
比如,騰訊就通過和北大共建聯(lián)合實驗室,共同開拓開源生態(tài)。Angel深度學(xué)習(xí)引擎誕生的背景,就是這樣的產(chǎn)學(xué)結(jié)合。
王巨宏指出,這樣的模式能培養(yǎng)出既在學(xué)術(shù)上有鉆研,又能結(jié)合產(chǎn)業(yè)發(fā)展的綜合性人才。這樣的人才不但是企業(yè)所需要的,在實驗室里也能起到榜樣作用。
這也正是騰訊廣告算法大賽的初衷:通過業(yè)務(wù)場景,通過比賽的方式,推動產(chǎn)學(xué)交流融合。
當(dāng)來自學(xué)術(shù)界的智慧,與產(chǎn)業(yè)界的實戰(zhàn)經(jīng)驗碰撞,正在飄過的機(jī)會氣球才能被精準(zhǔn)射落。
騰訊廣告算法大賽的第四年
說起來,今年是騰訊廣告算法大賽的第四年。
從獎金規(guī)模上看,也是規(guī)模最大的一次,僅冠軍獎金就有50萬元,總獎金池超百萬人民幣。
對于比賽中表現(xiàn)優(yōu)異的團(tuán)隊,騰訊還提供了面試直通的機(jī)會。
不過,能吸引到上萬選手的關(guān)注,很重要的一點(diǎn)是,比賽提供海量真實場景數(shù)據(jù),題目均來自實踐環(huán)節(jié)。
騰訊廣告副總裁蔣杰介紹,現(xiàn)在,在數(shù)字營銷方面,人工智能已經(jīng)扮演了非常重要的角色。
通過基于AI算法的大規(guī)模實時處理系統(tǒng),利用AI技術(shù)挖掘潛層數(shù)據(jù)、挖掘廣告跟用戶之間更深層的轉(zhuǎn)化鏈路,能讓廣告更加個性化,讓用戶的廣告體驗變得更好。
比如,騰訊廣告在實際業(yè)務(wù)中,就在用AI技術(shù)幫助大型傳統(tǒng)企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型——
結(jié)合計算機(jī)視覺技術(shù)、NLP等技術(shù)建立清晰的用戶人群畫像,充分發(fā)揮廣告主之間數(shù)據(jù)的潛能,再利用機(jī)器學(xué)習(xí)推薦算法,讓廣告能在適合的時間點(diǎn)推送出去,最大化傳播效果。
今年的賽題“廣告受眾基礎(chǔ)屬性預(yù)估”,同樣提取自這樣的業(yè)務(wù)場景之中。
參賽者需要綜合運(yùn)用機(jī)器學(xué)習(xí)領(lǐng)域的各種技術(shù),從用戶在廣告系統(tǒng)中的交互行為出發(fā),進(jìn)行反向預(yù)估(所有數(shù)據(jù)均為脫敏處理后的數(shù)據(jù))。
這種反向打通的操作在用戶統(tǒng)計、數(shù)據(jù)挖掘等真實的廣告投放場景中極具實踐價值,且可以幫助缺乏用戶信息的廣告從業(yè)者,在更廣的人群上實現(xiàn)智能定向或者受眾保護(hù)。
并且,由于許多高校尚未復(fù)課,大賽官方今年提供了充足的資源。不僅攜手了騰訊云、騰訊大數(shù)據(jù)、騰訊招聘及騰訊高校合作等合作伙伴。更是有騰訊會議為大賽全程提供遠(yuǎn)程協(xié)同、線上會議及直播等服務(wù)。
計算資源方面,騰訊云智能鈦機(jī)器學(xué)習(xí)平臺(TI-ONE)是為AI工程師打造的一站式機(jī)器學(xué)習(xí)服務(wù)平臺,作為大賽期間唯一指定的機(jī)器學(xué)習(xí)平臺,TI-ONE將為參賽選手提供從數(shù)據(jù)預(yù)處理、模型構(gòu)建、模型訓(xùn)練、模型評估的全流程訓(xùn)練能力。
與此同時,大賽推薦使用針對稀疏高維模型優(yōu)化的Angel訓(xùn)練框架。Angel是騰訊大數(shù)據(jù)自研并開源的高性能分布式機(jī)器學(xué)習(xí)框架,支持萬億級超大規(guī)模參數(shù)模型,支持統(tǒng)計學(xué)習(xí)、深度學(xué)習(xí)、圖機(jī)器學(xué)習(xí)等多種算法。
正如大數(shù)據(jù)與人工智能專家劉鵬所說,同學(xué)們想要在自己的實驗室里拿到這樣量級的工業(yè)界真實數(shù)據(jù),幾乎是不可能的,所以騰訊廣告算法大賽這樣的機(jī)會,對于同學(xué)們來說是極好的練兵機(jī)會,也是檢驗學(xué)習(xí)成果的良機(jī)。
崔斌教授也說,現(xiàn)在,比賽與應(yīng)用更加緊密,無論是對學(xué)生還是對公司而言,都是很有收獲的一件事。
其實,這樣的機(jī)會連騰訊內(nèi)部員工都表示眼饞。
王巨宏在直播中分享了一件趣事:從去年開始,騰訊內(nèi)部員工對算法大賽就十分感興趣,于是今年,騰訊廣告算法大賽開辟了雙向賽道,一個外部賽道,一個內(nèi)部賽道。也就是說,今年騰訊內(nèi)部的頂尖高手也會在這場比賽中露一手。
總之,借助騰訊廣告這個業(yè)務(wù)場景,加上騰訊云的強(qiáng)大算力,AI技術(shù)在這里被精準(zhǔn)地應(yīng)用,也為研究社區(qū)孵化出了基于真實的開放數(shù)據(jù)集,以及廣迎人才、鍛煉人才的算法大賽。
目前,騰訊廣告算法大賽仍在報名中,報名截止日期為5月31日。
今年,比賽將采取線上參賽的形式,初賽階段時間為5月7日至6月22日,復(fù)賽階段時間為6月23日至7月22日,決賽將在8月份進(jìn)行。
你,也來試試身手?