借助同態(tài)加密和聯(lián)邦學(xué)習(xí),各團(tuán)隊(duì)能在共享數(shù)據(jù)與分析的同時(shí)保護(hù)實(shí)際信息。
12月初的線上英特爾研究院開(kāi)放日活動(dòng)上,該公司兩名研究人員表示:采用同態(tài)加密與聯(lián)邦學(xué)習(xí)技術(shù),公司企業(yè)和研究人員能在不暴露實(shí)際數(shù)據(jù)的情況下,協(xié)同分析數(shù)據(jù)和創(chuàng)建機(jī)器學(xué)習(xí)模型,有效避免數(shù)據(jù)泄露風(fēng)險(xiǎn)。
協(xié)作團(tuán)隊(duì)可使用聯(lián)邦學(xué)習(xí)創(chuàng)建通用機(jī)器學(xué)習(xí)模型,以自身內(nèi)部數(shù)據(jù)加以訓(xùn)練,再安全收集并組合這些分散的模型,建立起融合各參與方數(shù)據(jù)的更為精確的迭代。同態(tài)加密更加通用,是密碼學(xué)特殊領(lǐng)域的成果,專注加密狀態(tài)下的數(shù)據(jù)計(jì)算,例如加密數(shù)據(jù)搜索和機(jī)器學(xué)習(xí)算法訓(xùn)練。同態(tài)加密可以在切實(shí)保護(hù)隱私的同時(shí)維持信息的可用性。
英特爾已加倍投注這兩種技術(shù),在其硬件中以軟件保護(hù)擴(kuò)展(SGX)提供支持。英特爾安全情報(bào)團(tuán)隊(duì)首席工程師Jason Martin稱,這樣可降低同態(tài)加密與聯(lián)邦學(xué)習(xí)技術(shù)的應(yīng)用成本。
他表示:“未處理的數(shù)據(jù)是無(wú)用數(shù)據(jù)。我們將不斷增長(zhǎng)的龐大數(shù)據(jù)轉(zhuǎn)化為有用數(shù)據(jù)的主要工具是機(jī)器學(xué)習(xí)和統(tǒng)計(jì)技術(shù),但公司企業(yè)因安全和隱私問(wèn)題而對(duì)數(shù)據(jù)共享顧慮重重。
今年的英特爾研究院開(kāi)放日活動(dòng)上,英特爾加密數(shù)據(jù)計(jì)算首席工程師Martin和Rosario Cammarota披露了該公司對(duì)這方面技術(shù)的研究與規(guī)劃。
安全共享與分析數(shù)據(jù)已成為重要研究問(wèn)題。今年,麻省理工學(xué)院一支多學(xué)科研究團(tuán)隊(duì)創(chuàng)建了采用隱私保護(hù)加密的系統(tǒng),公司企業(yè)可利用此系統(tǒng)在不披露實(shí)際數(shù)據(jù)的情況下共享安全事件信息。雖然某些公司,例如Duality和Enveil,專注特定于安全的同態(tài)加密應(yīng)用,英特爾卻希望通過(guò)在其芯片上提供支持,來(lái)拓寬同態(tài)加密的可能性。
Cammarota稱:“現(xiàn)在這個(gè)時(shí)候,我們所知的很多進(jìn)展都需要滿足應(yīng)用科學(xué),我們?cè)谶@方面探索的意義正在于此。業(yè)界需要出現(xiàn)更多的理論進(jìn)展和標(biāo)準(zhǔn)化,而英特爾正參與其中。”
聯(lián)邦學(xué)習(xí)和同態(tài)加密這樣的技術(shù),可使公司企業(yè)能夠在保持自身數(shù)據(jù)控制權(quán)的同時(shí)通力協(xié)作。
聯(lián)合數(shù)據(jù)可以解決兩個(gè)問(wèn)題:其一是限制數(shù)據(jù)使用的數(shù)據(jù)割裂問(wèn)題。這個(gè)問(wèn)題之所以產(chǎn)生,是因?yàn)槌鲇陔[私顧慮、知識(shí)產(chǎn)權(quán)考慮或監(jiān)管體制擔(dān)憂而無(wú)法傳輸信息。另一個(gè)更為實(shí)際的問(wèn)題是數(shù)據(jù)集的體量。帶寬限制束縛了公司企業(yè)直接共享大量數(shù)據(jù)集的腳步,導(dǎo)致無(wú)法集中訓(xùn)練機(jī)器學(xué)習(xí)模型。
醫(yī)療健康和金融服務(wù)行業(yè)寄希望于借助聯(lián)邦學(xué)習(xí)在不違反隱私規(guī)定或泄露敏感信息的情況下協(xié)作。為了能夠運(yùn)用各個(gè)獨(dú)立數(shù)據(jù)集識(shí)別腦部腫瘤,賓夕法尼亞大學(xué)采用聯(lián)邦學(xué)習(xí)訓(xùn)練機(jī)器學(xué)習(xí)模型。該聯(lián)邦學(xué)習(xí)方法最終訓(xùn)練出了性能提升17%的機(jī)器學(xué)習(xí)模型。
Martin稱:“聯(lián)邦學(xué)習(xí)方法中,我們將計(jì)算任務(wù)打散分發(fā)到各個(gè)獨(dú)立數(shù)據(jù)集,每家醫(yī)院都有自己的基礎(chǔ)設(shè)施。一部分訓(xùn)練在各個(gè)獨(dú)立數(shù)據(jù)集處執(zhí)行,然后這些分散的模型被推送到聚合服務(wù)器,由聚合器將各個(gè)模型組合成經(jīng)更新的全局模型。”
采用同態(tài)加密就可以直接對(duì)密文執(zhí)行數(shù)據(jù)分析,無(wú)需先解密數(shù)據(jù)。該技術(shù)呈現(xiàn)了無(wú)需實(shí)際暴露數(shù)據(jù)就能分析的美好前景。
但前途是光明的,道路是曲折的。同態(tài)加密會(huì)導(dǎo)致數(shù)據(jù)體量暴漲,密文體積會(huì)比原始數(shù)據(jù)大上100到1000倍。計(jì)算復(fù)雜度也顯著上升,能升至1萬(wàn)到100萬(wàn)倍,導(dǎo)致即使是很簡(jiǎn)單的功能,實(shí)際實(shí)現(xiàn)成本也很高昂。
不過(guò),Cammarota提醒道,業(yè)界此前其實(shí)也應(yīng)對(duì)過(guò)此類挑戰(zhàn)。1960年,一個(gè)晶體管就要1到4美元(相當(dāng)于現(xiàn)在的8到30美元)。時(shí)至今日,晶體管價(jià)格下降到不足原先的十億分之一。
如果同態(tài)加密實(shí)現(xiàn)的成本能降下來(lái),預(yù)期未來(lái)也會(huì)出現(xiàn)類似的應(yīng)用普及潮。
Cammarota表示:“晶體管技術(shù)一開(kāi)始擴(kuò)展,晶體管價(jià)格一變?yōu)榘撞藘r(jià),前所未見(jiàn)的應(yīng)用就成為了現(xiàn)實(shí)。只要同態(tài)加密實(shí)現(xiàn)成本降低,我們將見(jiàn)證該技術(shù)的無(wú)限可能。”
來(lái)源:數(shù)世咨詢