數(shù)牘科技蔡超超:數(shù)據(jù)價(jià)值挖掘和保護(hù)可以兼顧,隱私計(jì)算已有不少落地案例丨MEET2022
有數(shù)據(jù)價(jià)值交換的地方,就有隱私計(jì)算需求的存在。
編輯部 整理自 MEET 2022
量子位 報(bào)道 | 公眾號(hào) QbitAI
AI和大數(shù)據(jù)時(shí)代,我們似乎總在面臨隱私和便利性的抉擇。
例如,交出自己的定位信息和設(shè)備信息,獲取導(dǎo)航的便利性;交出自己的面部信息和個(gè)人信息,獲取身份認(rèn)證的便利性;交出自己的電話信息,獲取快遞外賣(mài)上門(mén)的便利性……
但數(shù)據(jù)流通范圍越大,信息泄露的概率也就越大,說(shuō)不定你的信息被數(shù)次轉(zhuǎn)手后,就被低價(jià)賣(mài)給了不法分子。
這種情況下,一種嘗試兼顧信息保護(hù)和數(shù)據(jù)流通兩大特點(diǎn)的技術(shù)體系浮出水面,它便是隱私計(jì)算。
在MEET 2022智能未來(lái)大會(huì)現(xiàn)場(chǎng),數(shù)牘科技聯(lián)合創(chuàng)始人兼CTO蔡超超指出:
有數(shù)據(jù)價(jià)值交換的地方,就有隱私計(jì)算需求的存在。
為了完整體現(xiàn)蔡超超對(duì)于隱私計(jì)算的思考,在不改變?cè)獾幕A(chǔ)上,量子位對(duì)他的演講內(nèi)容進(jìn)行了編輯整理。希望也能給你帶來(lái)新的啟發(fā)。
關(guān)于MEET 智能未來(lái)大會(huì):MEET大會(huì)是由量子位主辦的智能科技領(lǐng)域頂級(jí)商業(yè)峰會(huì),致力于探討前沿科技技術(shù)的落地與行業(yè)應(yīng)用。MEET2022采取線上參會(huì)形式,20余家直播平臺(tái)和渠道轉(zhuǎn)播大會(huì)直播,200萬(wàn)行業(yè)用戶線上參會(huì)。除量子位微信、頭條號(hào)、知乎、微博等全媒體矩陣外,新華社、鳳凰科技、騰訊科技、澎湃新聞等數(shù)十家主流媒體紛紛報(bào)道大會(huì)及相關(guān)內(nèi)容,線上曝光量累計(jì)超過(guò)2000萬(wàn)。
演講要點(diǎn)
- 數(shù)據(jù)的開(kāi)放共享,建立在安全保護(hù)的基礎(chǔ)上;數(shù)據(jù)價(jià)值的挖掘,更需要底層基礎(chǔ)設(shè)施的保駕護(hù)航。
- 有數(shù)據(jù)價(jià)值交換的地方,就有隱私計(jì)算需求的存在。
- 隱私計(jì)算體系不是單一的系統(tǒng),而是一個(gè)網(wǎng)絡(luò)、一個(gè)底層平臺(tái)。
- 基于隱私計(jì)算的ID系統(tǒng)可以達(dá)到匿名化要求,無(wú)法識(shí)別特定自然人且不可追溯。
- 隨著越來(lái)越多復(fù)雜的隱私計(jì)算應(yīng)用場(chǎng)景出現(xiàn),多種技術(shù)的融合是行業(yè)的必然趨勢(shì)。
(以下為蔡超超演講分享全文)
隱私計(jì)算究竟是什么?
今天,我將分享的主題是“隱私計(jì)算,構(gòu)建下一代數(shù)據(jù)流通的底層關(guān)鍵技術(shù)”。
剛剛,有幾位不同行業(yè)的專家都提到了AI和數(shù)據(jù)的開(kāi)發(fā)與利用,比如智能駕駛。其實(shí)我接下來(lái)講到的隱私計(jì)算,也會(huì)涉及智能駕駛的場(chǎng)景。
現(xiàn)代汽車(chē)如同智能手機(jī)一般,是高度信息化和智能化的。在運(yùn)行過(guò)程中,汽車(chē)上的設(shè)備會(huì)采集大量圖片、音頻和位置等數(shù)據(jù),其中就包含不少車(chē)主的隱私數(shù)據(jù)。
如何在保護(hù)數(shù)據(jù)安全的情況下,高效開(kāi)發(fā)并利用數(shù)據(jù),涉及到隱私計(jì)算的技術(shù)支撐。
不僅是汽車(chē)行業(yè)。我國(guó)在國(guó)家戰(zhàn)略層面上,全面提出要推動(dòng)數(shù)據(jù)要素市場(chǎng)發(fā)展與數(shù)據(jù)資源的開(kāi)放利用。
數(shù)據(jù)的開(kāi)放共享,建立在安全保護(hù)的基礎(chǔ)上;數(shù)據(jù)價(jià)值的挖掘,更需要底層基礎(chǔ)設(shè)施的保駕護(hù)航。
隱私計(jì)算,是數(shù)據(jù)流通的重要組成部分。據(jù)估計(jì),隱私計(jì)算技術(shù)的全球市場(chǎng)規(guī)模達(dá)到一萬(wàn)億,Gartner更是它作為2022年需要探索的重要戰(zhàn)略技術(shù)。
隱私計(jì)算將覆蓋金融、政務(wù)、互聯(lián)網(wǎng)等領(lǐng)域,可以說(shuō)有數(shù)據(jù)價(jià)值交換的地方,就有隱私計(jì)算需求的存在。
隱私計(jì)算具體是什么?
它是一種在數(shù)據(jù)不可見(jiàn)的前提下,讓信息進(jìn)行價(jià)值流通的工程體系。
它的成熟和落地,需要靠多項(xiàng)技術(shù)的共同發(fā)展來(lái)支撐,包括數(shù)十年密碼學(xué)理論的積累、云計(jì)算的發(fā)展、MPC技術(shù)突破、AI技術(shù)的覆蓋和大數(shù)據(jù)基礎(chǔ)設(shè)施的完善。
隱私計(jì)算不是單一的技術(shù),而是一個(gè)技術(shù)體系,包含多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、可信執(zhí)行環(huán)境、差分隱私、同態(tài)加密、區(qū)塊鏈等技術(shù),可以實(shí)現(xiàn)數(shù)據(jù)的可信挖掘以及可信存證。
不過(guò),隱私計(jì)算體系也不是單一的系統(tǒng),而是一個(gè)網(wǎng)絡(luò)、一個(gè)底層平臺(tái),這個(gè)平臺(tái)包含各種參與方,可以由人、物、汽車(chē)或其他各種各樣的主體組成。
具體來(lái)說(shuō),每個(gè)主體都擁有一個(gè)專屬I(mǎi)D,像身份證、電話號(hào)碼、設(shè)備號(hào)、汽車(chē)的VIN number等等。因此,在進(jìn)行數(shù)據(jù)合作之前,需要一個(gè)共同語(yǔ)言把這些ID有效地映射(mapping)起來(lái),使之成為數(shù)據(jù)的統(tǒng)一語(yǔ)言,以進(jìn)行安全數(shù)據(jù)協(xié)作。
為了實(shí)現(xiàn)這個(gè)系統(tǒng),由數(shù)牘科技參與研發(fā)和運(yùn)營(yíng),中國(guó)信通院、中國(guó)商務(wù)廣告協(xié)會(huì)聯(lián)合電信運(yùn)營(yíng)商,共同推出了行業(yè)通行ID「ONEID」。
不交換原始數(shù)據(jù),也能安全完成數(shù)據(jù)協(xié)作
ONEID是一個(gè)依托中國(guó)信通院數(shù)據(jù)安全體系,基于運(yùn)營(yíng)商認(rèn)證能力生成匿名廣告標(biāo)識(shí),結(jié)合隱私計(jì)算的,是一個(gè)符合中國(guó)法律法規(guī)的獨(dú)立于手機(jī)操作系統(tǒng)生態(tài)的ID體系。
基于隱私計(jì)算的ID系統(tǒng)可以達(dá)到匿名化要求,無(wú)法識(shí)別特定自然人且不可追溯,還可以充分保證信息安全性,有效將多方ID進(jìn)行對(duì)齊,提供后續(xù)數(shù)據(jù)價(jià)值流通的可能性。
在完成數(shù)據(jù)對(duì)齊后,還需要更進(jìn)一步的數(shù)據(jù)價(jià)值流動(dòng)。
因此,除了ONEID系統(tǒng),數(shù)牘科技還推出了自主研發(fā)的隱私計(jì)算平臺(tái)Tusita,在不交換原始數(shù)據(jù)的前提下,讓多方能夠進(jìn)行安全合規(guī)的數(shù)據(jù)協(xié)作。
這里有兩個(gè)非常典型的例子。
第一個(gè)例子,今年8月,廣東人民檢察院公布了一起典型的訴訟案。案例顯示,某銀行王姓客戶經(jīng)理,近兩年利用職務(wù)之便,非法出售了31465條在業(yè)務(wù)活動(dòng)中獲取的銀行客戶賬戶信息,以此賺取收益。
這些被非法出售的信息包括不少像客戶姓名、身份證號(hào)碼、電話號(hào)碼、銀行卡賬號(hào)這樣的敏感信息,大多數(shù)流向了貸款公司,被用于電話銷(xiāo)售。
在信息流通中,由于缺乏一個(gè)有效安全的技術(shù)措施,導(dǎo)致客戶的具體信息被有意或無(wú)意泄露,相關(guān)隱私信息出現(xiàn)不可控性。
第二個(gè)例子,也是在今年8月,另一個(gè)地區(qū)的一家中小微企業(yè)想去申請(qǐng)銀行貸款。由于公司起步不久,財(cái)務(wù)制度還不健全,加上銀行擁有的信息樣本有限,導(dǎo)致銀行在進(jìn)行貸前調(diào)查時(shí),往往需要花費(fèi)很多人力和成本,這家小微企業(yè)也難以及時(shí)申請(qǐng)到貸款。
這兩個(gè)案例說(shuō)明,一方面?zhèn)€人信息亟待保護(hù),另一方面數(shù)據(jù)流通又已經(jīng)成為一種剛需。
因此,在合法合規(guī)的前提下,引入多維度高價(jià)值數(shù)據(jù)非常重要。
基于這些痛點(diǎn)打造的Tusita隱私計(jì)算平臺(tái),可以有效地平衡數(shù)據(jù)挖掘和數(shù)據(jù)保護(hù)的需求,目前已經(jīng)在金融、電信、消費(fèi)品、政務(wù)等多個(gè)行業(yè)得到了落地與應(yīng)用。
解決數(shù)據(jù)泄露、本地緩存等問(wèn)題
在金融行業(yè),我們推出了一整套面向數(shù)據(jù)的、全生命周期的安全協(xié)作解決方案,覆蓋風(fēng)控、營(yíng)銷(xiāo)、金融集團(tuán)內(nèi)部協(xié)作、存量客戶分層運(yùn)營(yíng)等應(yīng)用場(chǎng)景,目前已經(jīng)有不少具體的落地案例。
舉個(gè)例子,在貸前準(zhǔn)入的數(shù)據(jù)協(xié)作場(chǎng)景中,金融機(jī)構(gòu)通常需要對(duì)客戶進(jìn)行多要素的實(shí)名認(rèn)證及相關(guān)核驗(yàn)。
傳統(tǒng)模式下,雙方機(jī)構(gòu)通過(guò)系統(tǒng)對(duì)接,其中金融機(jī)構(gòu)需要通過(guò)API來(lái)查詢數(shù)據(jù)、驗(yàn)證客戶相關(guān)信息。這種模式容易導(dǎo)致金融機(jī)構(gòu)潛在客戶信息被泄露,或是運(yùn)營(yíng)商則數(shù)據(jù)被緩存。
隱私計(jì)算平臺(tái)則能很好地解決上述問(wèn)題。通過(guò)平臺(tái),金融機(jī)構(gòu)可以通過(guò)三要素驗(yàn)證等方式,查詢匹對(duì)電信運(yùn)營(yíng)商的客戶信息名單,在不泄露客戶信息的情況下,查驗(yàn)三要素信息是否正確。
在這種情況下,隱私數(shù)據(jù)就能確?!翱捎貌豢梢?jiàn)”。
其中,數(shù)據(jù)方無(wú)需獲取用戶信息,就能統(tǒng)計(jì)查詢筆數(shù);查詢方不能獲知數(shù)據(jù)方除交集數(shù)據(jù)外的其他數(shù)據(jù),但客戶三要素等信息也不需要出庫(kù),無(wú)需擔(dān)心第三方緩存的問(wèn)題。
針對(duì)不同的行業(yè)場(chǎng)景,隱私計(jì)算產(chǎn)品Tusita可以用于反欺詐、反洗錢(qián)、精準(zhǔn)營(yíng)銷(xiāo)、聯(lián)合風(fēng)控、賦能保險(xiǎn)企業(yè)數(shù)字化運(yùn)營(yíng)等一系列場(chǎng)景。
除此之外,隱私計(jì)算平臺(tái)還可以用于支持企業(yè)的數(shù)字化運(yùn)營(yíng)。
例如,保險(xiǎn)公司會(huì)通過(guò)正向方式,獲得一些存量客戶線索。然而,由于客戶與保險(xiǎn)公司的互動(dòng)極少,使得公司無(wú)法對(duì)存量客戶進(jìn)行有效挖掘。
為此,我們通過(guò)隱私計(jì)算的方式,采用數(shù)據(jù)對(duì)客戶進(jìn)行多重的客戶分層與挖掘,使得中間具有高意向購(gòu)買(mǎi)其他長(zhǎng)期險(xiǎn)種的客戶也能得到有效分層排序,最終讓保險(xiǎn)公司的整體投保率提升1.8倍。
當(dāng)然,這種方式不僅可以賦能于保險(xiǎn)行業(yè),也能應(yīng)用于任何企業(yè)營(yíng)銷(xiāo)或者數(shù)字化經(jīng)營(yíng)行業(yè)。
除了金融、保險(xiǎn)行業(yè),數(shù)牘科技也與運(yùn)營(yíng)商之間有著非常緊密的合作。
目前,數(shù)牘科技已經(jīng)成為運(yùn)營(yíng)商第二代數(shù)據(jù)的底座建設(shè)平臺(tái)提供商,為他們提供整體的隱私計(jì)算解決方案。
“需要完整的數(shù)據(jù)科學(xué)應(yīng)用體系支撐”
作為一個(gè)初創(chuàng)企業(yè),數(shù)牘科技成立于2019年,這兩年一直在高速發(fā)展。
2019年成立后,發(fā)布了第一版全國(guó)產(chǎn)化的自研隱私計(jì)算平臺(tái)體系;2020年,數(shù)牘科技在行業(yè)內(nèi)首先落地運(yùn)營(yíng)商場(chǎng)景,成為聯(lián)通隱私計(jì)算平臺(tái)技術(shù)合作方,并與聯(lián)通共同完成行業(yè)首個(gè)TB級(jí)隱私計(jì)算商用項(xiàng)目落地;在2020和2021年,為多家頭部國(guó)有銀行提供隱私計(jì)算服務(wù)和技術(shù)支撐。
2021年,我們先后入選上海數(shù)據(jù)交易所、西部數(shù)據(jù)交易中心首批簽約數(shù)商,并將作為深圳數(shù)據(jù)交易所首批數(shù)據(jù)服務(wù)商之一參與數(shù)據(jù)交易服務(wù),為深圳數(shù)據(jù)交易所提供數(shù)據(jù)流通環(huán)節(jié)中的隱私計(jì)算技術(shù)支撐。
我們堅(jiān)信,在隱私計(jì)算平臺(tái)的發(fā)展過(guò)程當(dāng)中,需要特別注重以下幾點(diǎn)。
第一點(diǎn),安全可靠性。這也是我們Tusita平臺(tái)一直堅(jiān)持的目標(biāo),即通過(guò)“計(jì)算分布式,流通可監(jiān)管”的架構(gòu),使得客戶能以本地存儲(chǔ)與完全可控的模式管理數(shù)據(jù),平臺(tái)不參與計(jì)算、不觸碰具體數(shù)據(jù)。
第二點(diǎn),完整的數(shù)據(jù)科學(xué)應(yīng)用體系。平臺(tái)可以實(shí)現(xiàn)完整的數(shù)據(jù)分析、特征加工、全流程可視化模型建設(shè)與后續(xù)挖掘。
第三點(diǎn),工業(yè)級(jí)的落地能力。平臺(tái)需要具備高擴(kuò)展性、支持快速部署,同時(shí)也支持海量數(shù)據(jù)的挖掘和分析,包括億級(jí)模型建設(shè)以及數(shù)十億級(jí)數(shù)據(jù)分析的能力。我們已經(jīng)服務(wù)了像運(yùn)營(yíng)商、金融、政務(wù)等多個(gè)行業(yè)的客戶,為國(guó)有企業(yè)、央企與政府之間的數(shù)據(jù)合作提供了廣泛落地支撐。
隨著越來(lái)越多復(fù)雜的隱私計(jì)算應(yīng)用場(chǎng)景出現(xiàn),多種技術(shù)的融合是行業(yè)的必然趨勢(shì)。
大家可以關(guān)注一下我們的公眾號(hào)(數(shù)牘科技),上面有我們的進(jìn)展、行業(yè)研究,以及一些行業(yè)報(bào)告;有興趣也可以持續(xù)關(guān)注一下我們的ONEID產(chǎn)品,謝謝。