清華姚班的科研能力,能孵化出一家怎樣的公司?
轉(zhuǎn)化姚期智科研成果,清華教授任首席科學(xué)家
魚羊 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
Top2大學(xué)實驗室里的科研成果,能孵化出怎樣的商業(yè)價值?
現(xiàn)在,清華大學(xué)的又一張王牌浮出水面——
轉(zhuǎn)化圖靈獎得主姚期智院士和清華大學(xué)交叉信息學(xué)院徐葳副教授在隱私計算理論方面的研究成果,成立華控清交信息科技(北京)有限公司,還推出了實際可落地的商業(yè)產(chǎn)品。
前高盛全球合伙人張旭東出任CEO,徐葳副教授擔(dān)任首席科學(xué)家,還有多位清華姚班畢業(yè)生擔(dān)當(dāng)研發(fā)骨干。
沒錯,這家公司背靠的就是清華姚班人才力量,以及清華大學(xué)雄厚的學(xué)術(shù)資源。
都說「半國英才聚清華,而清華一半英才在姚班」,所以,這樣的學(xué)術(shù)背景之中,到底孵化出了一家怎樣的公司?
讓數(shù)據(jù)「可用不可見」
業(yè)內(nèi)都知道,圖靈獎得主、清華大學(xué)交叉信息研究院院長姚期智院士的主要研究方向,包含了計算理論及其在密碼學(xué)和量子計算中的應(yīng)用。
而華控清交正是抓住了「數(shù)據(jù)安全」這個點,基于姚期智院士和徐葳教授的科研成果,專注于研發(fā)和建設(shè)基于多方安全計算理論的數(shù)據(jù)融合技術(shù)、標(biāo)準(zhǔn)和基礎(chǔ)設(shè)施。
分析起來,原因其實很簡單:數(shù)據(jù)安全問題正在影響數(shù)據(jù)流通,掣肘數(shù)字經(jīng)濟(jì)發(fā)展。
在數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)可以說是關(guān)鍵生產(chǎn)要素。
人工智能技術(shù)能在寒冬之后再次復(fù)蘇,引領(lǐng)時代技術(shù)潮流,就得益于互聯(lián)網(wǎng)帶來的海量數(shù)據(jù)。
不過,隨著AI產(chǎn)品逐漸滲透到人們的生活當(dāng)中,數(shù)據(jù)引發(fā)的隱私安全問題,也越來越受到大眾的關(guān)注。
從人臉識別到智能音箱,從推薦算法到視頻通訊,無不挑動人們對隱私安全的敏感神經(jīng)。
從隱私安全的角度來說,數(shù)據(jù)作為生產(chǎn)要素,和一般生產(chǎn)要素相比有以下特點:
首先,數(shù)據(jù)的復(fù)制成本低,幾乎可無限被復(fù)制;
其次,數(shù)據(jù)使用沒有排他性,可同時被多方使用;
另外,數(shù)據(jù)可再生性強(qiáng),在使用過程中會隨時生產(chǎn)出新的數(shù)據(jù)。
這些特點導(dǎo)致未加密的明文數(shù)據(jù)一旦被共享,就不再受到控制,很有可能被濫用。這也致使各方不敢共享、不愿共享、不能共享數(shù)據(jù)。
如此一來,數(shù)據(jù)生產(chǎn)要素化就受到了掣肘,「數(shù)據(jù)孤島」現(xiàn)象在各行各業(yè)中普遍存在。
那么,能不能從技術(shù)角度來解決這個問題,讓數(shù)據(jù)能夠在流通、最大化發(fā)揮價值的同時,防止信息泄露和數(shù)據(jù)濫用?
答案是:可以。
比如姚期智院士在上世紀(jì)80年代創(chuàng)立的多方安全計算理論,就為實現(xiàn)數(shù)據(jù)可用不可見奠定了理論基礎(chǔ)。
所謂「可用不可見」,就是將數(shù)據(jù)分離成可見的具體信息部分和不可見的計算價值部分。這樣一來,就在計算價值充分流通、共享的同時,規(guī)避了信息泄露的風(fēng)險。
具體而言,華控清交的隱私計算技術(shù),是基于多方安全計算密碼學(xué)范疇的理論安全性優(yōu)勢,結(jié)合聯(lián)邦學(xué)習(xí)、可信計算、差分隱私和數(shù)據(jù)脫敏等基于明文的數(shù)據(jù)隱私保護(hù)技術(shù)和區(qū)塊鏈技術(shù),創(chuàng)建的一套明文和密文相結(jié)合的系統(tǒng)。
并且,華控清交在工程上也已經(jīng)實現(xiàn)了「數(shù)據(jù)可用不可見」和「規(guī)定數(shù)據(jù)具體用途用量」的實際落地,推出了自主研發(fā)的數(shù)據(jù)安全融合平臺。
數(shù)據(jù)交易流通的基礎(chǔ)設(shè)施
根據(jù)官網(wǎng)信息,這一名為PrivPy多方安全計算平臺的平臺級產(chǎn)品已經(jīng)實現(xiàn)了支持通用計算類型、高性能、集群化和可擴(kuò)展的解決方案。
PrivPy集成了多方安全計算、聯(lián)邦學(xué)習(xí)、隱私查詢等數(shù)據(jù)安全技術(shù),運用了秘密分享、混淆電路和可信計算等多種計算引擎。
其高性能并行計算引擎,支持橫向擴(kuò)展和數(shù)據(jù)并行,以及TB級的數(shù)據(jù)處理。
另外,該平臺完全兼容ARM服務(wù)器,支持細(xì)粒度并行計算。
在開發(fā)方面,平臺支持Python和SQL操作,兼容NumPy和Pytorch等函數(shù)庫,能夠支持包括絕大多數(shù)機(jī)器學(xué)習(xí)算法在內(nèi)的計算類型和系統(tǒng)實現(xiàn),能極大降低用戶使用密文計算的學(xué)習(xí)曲線,實現(xiàn)了多方安全計算產(chǎn)品的實際可用性和商業(yè)易用性。
同時,PrivPy自主靈活的模塊化組合模式和多種部署方式能夠滿足用戶在使用和部署中的多樣化需求。
而在安全方面,該平臺具有以下特點:
- 完備的數(shù)學(xué)/密碼學(xué)證明
- 安全假設(shè)明確而且容易實現(xiàn)和審計
- 數(shù)據(jù)授權(quán)管理
- 系統(tǒng)實現(xiàn)安全:SSL、CA認(rèn)證等
- 核心密碼協(xié)議設(shè)計簡單而且開放
- 同時兼容國際開源和中國商密體系
- 兼容區(qū)塊鏈和可信計算的存證審計功能
- 獲得國內(nèi)權(quán)威機(jī)構(gòu)安全認(rèn)證
華控清交的愿景,是為國家開發(fā)建設(shè)一套具有自主知識產(chǎn)權(quán)的、世界領(lǐng)先的、數(shù)據(jù)交易流通的基礎(chǔ)設(shè)施,推動數(shù)據(jù)大規(guī)模的互連互通與融合利用,使數(shù)據(jù)真正成為社會化的生產(chǎn)要素,為我國全面進(jìn)入數(shù)字經(jīng)濟(jì)時代鋪設(shè)道路。
而現(xiàn)在,「吹」下的牛以產(chǎn)品形式穩(wěn)穩(wěn)落地,并且已經(jīng)有了實際的應(yīng)用案例。
應(yīng)用案例
在政務(wù)、金融、醫(yī)療、安防、能源等諸多領(lǐng)域,打通數(shù)據(jù)孤島,實現(xiàn)數(shù)據(jù)不出門的聯(lián)合建模,對于行業(yè)中AI技術(shù)的實際應(yīng)用有著重要的意義。
而從清華園中走出,華控清交的多方安全計算平臺已經(jīng)在這些行業(yè)中驗證了能力。
比如實現(xiàn)保護(hù)數(shù)據(jù)隱私的人臉識別支付。
人臉識別技術(shù)給金融行業(yè)帶來了很多方便,比如刷臉支付,對大眾而言已是習(xí)以為常的功能。
然而人臉數(shù)據(jù)作為極其重要的隱私數(shù)據(jù),無論是從保護(hù)用戶隱私數(shù)據(jù)方面,還是從保護(hù)數(shù)據(jù)價值方面,數(shù)據(jù)擁有方都不會愿意輕易地將其分享出來。同時,人臉查詢用戶也不愿向數(shù)據(jù)庫運營方提供自己客戶的人臉信息。
華控清交多方安全計算平臺,就能從技術(shù)層面解決人臉識別的隱私保護(hù)問題。
通過多方計算平臺,查詢方在查詢?nèi)四樞畔r,只會得到匹配的結(jié)果,平臺和數(shù)據(jù)源均無法得知查詢意圖和查詢結(jié)果。
也就是說,這一過程中查詢方和數(shù)據(jù)庫運營方互相不暴露自己的信息,也就避免了人臉特征數(shù)據(jù)庫信息泄露的風(fēng)險,從而使人臉數(shù)據(jù)數(shù)據(jù)擁有方能夠放心地將數(shù)據(jù)分享出來共同使用。
再以反欺詐為例。
所謂道高一尺魔高一丈,隨著市場和信息化手段的不斷發(fā)展,不法分子也在利用先進(jìn)技術(shù),以更隱蔽的行為和方法實施金融詐騙。
面對這樣的挑戰(zhàn),如果能將多個金融機(jī)構(gòu)的相關(guān)數(shù)據(jù)安全有效地融合在一起進(jìn)行人工智能分析和檢測,就能通過提高大數(shù)據(jù)池內(nèi)數(shù)據(jù)的質(zhì)和量來提升反欺詐的精準(zhǔn)度,建立更智能、更健全、更有效的風(fēng)控系統(tǒng)。
不過,金融機(jī)構(gòu)的用戶數(shù)據(jù)往往都有巨大的市場敏感度和潛在的商業(yè)價值。正因為如此,無論是從保護(hù)客戶隱私和市場安全考慮,還是從保護(hù)自身利益的角度出發(fā),各金融機(jī)構(gòu)都不會輕易地分享這些數(shù)據(jù)。
而華控清交的多方安全計算平臺,恰恰可以使擁有隱私數(shù)據(jù)的多方在不直接提供數(shù)據(jù)原文的前提下,利用其生成的數(shù)據(jù)密文進(jìn)行有效的數(shù)據(jù)融合與計算,可以在保證數(shù)據(jù)隱私的前提下完成大數(shù)據(jù)融合與人工智能運算。
具體而言,通過多方安全計算平臺,多個金融機(jī)構(gòu)可以將數(shù)據(jù)以密文的形式上傳,之后在平臺全密文環(huán)境下進(jìn)行反欺詐模型的聯(lián)合訓(xùn)練、預(yù)測,用更多樣化的數(shù)據(jù)鍛煉出更強(qiáng)大的AI,提升各自的反欺詐能力。
產(chǎn)學(xué)研融合之道
今年以來,在疫情沖擊之下,數(shù)字經(jīng)濟(jì)的新興產(chǎn)業(yè)優(yōu)勢更加凸顯出來,并成為構(gòu)建經(jīng)濟(jì)發(fā)展新格局的重要支撐。
而數(shù)據(jù),作為AI應(yīng)用的基礎(chǔ),作為數(shù)字經(jīng)濟(jì)中的生產(chǎn)要素,更是在這樣新的發(fā)展格局中發(fā)揮著關(guān)鍵作用。
在這樣的背景之下,如何在保障數(shù)據(jù)安全的前提下,促進(jìn)數(shù)據(jù)的流通,實現(xiàn)無邊界的數(shù)據(jù)融合,就成為了學(xué)術(shù)界、工業(yè)界共同面臨的全新挑戰(zhàn)。
而現(xiàn)在,以華控清交為代表的企業(yè)能從國內(nèi)最頂尖的實驗室中走出,將前沿技術(shù)理論落地商用,無疑為打通充分發(fā)揮數(shù)據(jù)潛能這一環(huán),注入了強(qiáng)有力的技術(shù)支撐。
其商業(yè)化成果,也再一次印證了產(chǎn)學(xué)研融合帶來的強(qiáng)大動能,探索出了AI賦能千行百業(yè)的一條新路徑。
那么,你怎么看待這樣的產(chǎn)學(xué)研融合之道呢?