螞蟻集團(tuán)開(kāi)源大規(guī)模全鏈路因果學(xué)習(xí)系統(tǒng)OpenASCE
還進(jìn)一步沉淀了20多個(gè)工業(yè)級(jí)因果學(xué)習(xí)算法
當(dāng)?shù)貢r(shí)間12月10日,為期6天的AI國(guó)際頂會(huì)NeurIPS?(Neural Information Processing Systems)?在美國(guó)路易斯安那州新奧爾良市開(kāi)幕。
NeurIPS是全球人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的頂級(jí)會(huì)議,與ICML并稱(chēng)為人工智能領(lǐng)域難度最大,水平最高,影響力最強(qiáng)的會(huì)議。

會(huì)議首日,中國(guó)互聯(lián)網(wǎng)企業(yè)螞蟻集團(tuán)受邀舉辦主題為“知識(shí)增強(qiáng) AI 在垂直行業(yè)的應(yīng)用探索”?(Knowledge-enhanced AI for Industry Verticals)的研討會(huì),并在會(huì)上開(kāi)源了業(yè)界首個(gè)分布式全鏈路因果學(xué)習(xí)系統(tǒng)OpenASCE?(Open All-Scale Causal Engine)。
因果推斷主要研究如何從數(shù)據(jù)中推斷因果關(guān)系,是數(shù)據(jù)科學(xué)領(lǐng)域的重要分支,而傳統(tǒng)的機(jī)器學(xué)習(xí)則主要依賴(lài)數(shù)據(jù)中的相關(guān)關(guān)系。
融合因果推斷和機(jī)器學(xué)習(xí)可以同時(shí)發(fā)揮兩者的強(qiáng)項(xiàng),我們稱(chēng)之為因果學(xué)習(xí)。
因果學(xué)習(xí)作為一種深入理解數(shù)據(jù)和決策背后關(guān)系的技術(shù),在數(shù)據(jù)驅(qū)動(dòng)的運(yùn)營(yíng)和決策中扮演著重要的角色。
OpenASCE根植于螞蟻集團(tuán)多年積累的實(shí)踐經(jīng)驗(yàn)和技術(shù)突破,相較于業(yè)界已有的一些開(kāi)源框架,支持全鏈路大規(guī)模因果學(xué)習(xí),包含因果發(fā)現(xiàn)、因果效應(yīng)估計(jì)和歸因,覆蓋了因果各個(gè)領(lǐng)域的相應(yīng)實(shí)現(xiàn)。
在因果發(fā)現(xiàn)上,OpenASCE支持分布式貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)搜索,能夠處理百節(jié)點(diǎn)百萬(wàn)樣本數(shù)據(jù);同時(shí)支持基于連續(xù)優(yōu)化的因果發(fā)現(xiàn),支持萬(wàn)級(jí)節(jié)點(diǎn)億級(jí)樣本數(shù)據(jù)。
OpenASCE 實(shí)現(xiàn)的大規(guī)模分布式因果糾偏樹(shù)可以在 4 小時(shí)內(nèi)完成 1 億樣本的訓(xùn)練任務(wù),是業(yè)界唯一的分布式因果提升樹(shù)實(shí)現(xiàn)。
此外,OpenASCE還進(jìn)一步沉淀了20多個(gè)工業(yè)級(jí)因果學(xué)習(xí)算法,包括15個(gè)以上因果技術(shù)和深度學(xué)習(xí)結(jié)合的因果表征學(xué)習(xí)方法,有效降低了因果技術(shù)的工業(yè)應(yīng)用門(mén)檻,在螞蟻集團(tuán)內(nèi)部實(shí)現(xiàn)了規(guī)?;瘧?yīng)用。
比如信貸風(fēng)控團(tuán)隊(duì)通過(guò)OpenASCE的因果學(xué)習(xí)方法,可以更準(zhǔn)確地識(shí)別出風(fēng)險(xiǎn)因素和客戶(hù)行為之間的因果關(guān)系,大幅提高了風(fēng)險(xiǎn)控制的精度和效率。
在營(yíng)銷(xiāo)優(yōu)化方面,OpenASCE能夠幫助營(yíng)銷(xiāo)人員有效尋找“營(yíng)銷(xiāo)敏感人群”,提升業(yè)務(wù)指標(biāo)。在推薦場(chǎng)景中,因果推斷可以幫助機(jī)器學(xué)習(xí)糾正數(shù)據(jù)中的偏置,去除偽相關(guān),學(xué)習(xí)更穩(wěn)定的因果關(guān)系。
據(jù)了解,技術(shù)開(kāi)源是螞蟻集團(tuán)的重要技術(shù)戰(zhàn)略,螞蟻集團(tuán)在人工智能、數(shù)據(jù)庫(kù)、云計(jì)算、隱私計(jì)算、安全可信等領(lǐng)域都擁有自主可控的關(guān)鍵開(kāi)源技術(shù),截至目前,共計(jì)開(kāi)源了1700多個(gè)代碼倉(cāng)庫(kù),積累了100多個(gè)社區(qū)頭部開(kāi)源項(xiàng)目。
《COPU2022 中國(guó)開(kāi)源發(fā)展藍(lán)皮書(shū)》顯示,螞蟻開(kāi)源影響力排名國(guó)內(nèi)前三,其中重點(diǎn)開(kāi)源的 9 大技術(shù)均為支撐支付寶的核心技術(shù)。