據(jù)外媒(opensources.info)報(bào)道,機(jī)器學(xué)習(xí)的進(jìn)步讓人們能夠以更方便的方式來(lái)訓(xùn)練安全系統(tǒng)以應(yīng)對(duì)不斷變化的安全形勢(shì)。
近段時(shí)間,機(jī)器學(xué)習(xí)和人工智能受到越來(lái)越多的關(guān)注。新技術(shù)帶來(lái)的諸多可能讓人們興奮不已。
一個(gè)事物一旦被貼上機(jī)器學(xué)習(xí)的標(biāo)簽,再想撕下來(lái)就難了。就像現(xiàn)在幾乎所有基于網(wǎng)絡(luò)發(fā)生的事情都能跟“云計(jì)算”扯上關(guān)系一樣,未來(lái)“人工智能”這個(gè)詞可能會(huì)跟“電腦”形影不離。
“大熱之下也有些夸張的成分,”普華永道(PricewaterhouseCoopers)分析師Anand Rao說(shuō)。“人們開(kāi)始討論AI變得超級(jí)聰明進(jìn)而取代人類(lèi)等等?!?/p>
在使用計(jì)算機(jī)的過(guò)程中,判斷新下載的文件或軟件是否含有惡意代碼是最常見(jiàn)的安全情形。通常的識(shí)別方法是將程序的數(shù)字簽名與已知的惡意軟件進(jìn)行對(duì)比,以辨別安全與否。
這種基本的識(shí)別手段有其缺點(diǎn):它依賴(lài)于惡意軟件數(shù)字特征庫(kù)的不斷隨時(shí)更新來(lái)保證識(shí)別能力。一旦更新落后或識(shí)別不及時(shí),后果令人堪憂(yōu)。一些特征不明顯的惡意軟件經(jīng)??梢暂p易蒙混過(guò)關(guān)。
一家名為Deep Instinct的新創(chuàng)企試圖使用深度學(xué)習(xí)技術(shù)來(lái)彌補(bǔ)此中不足。公司團(tuán)隊(duì)利用近10億個(gè)已知惡意軟件樣本對(duì)其深度學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練。
公司CTO Eli David 說(shuō):“深度學(xué)習(xí)改變了很多領(lǐng)域。計(jì)算機(jī)視覺(jué)每年增長(zhǎng)20%~30%,此外還有語(yǔ)音識(shí)別。于是我們想為什么深度學(xué)習(xí)不能應(yīng)用到網(wǎng)絡(luò)安全領(lǐng)域呢?”
他認(rèn)為基于概率大機(jī)器學(xué)習(xí)系統(tǒng)十分有限,盡管非常多的因素可以被識(shí)別和評(píng)估,與此同時(shí)那些太過(guò)微小的因子遭到忽略。
“如此你白白丟掉了絕大一部分?jǐn)?shù)據(jù)。”他說(shuō)。
作為糾正,Deep Instinct 實(shí)驗(yàn)室中無(wú)一遺漏地使用目前已知的所有惡意軟件樣本來(lái)訓(xùn)練其深度學(xué)習(xí)系統(tǒng)。整個(gè)過(guò)程耗時(shí)一整天。而且使用到高性能圖形處理器來(lái)進(jìn)行對(duì)數(shù)據(jù)的分析。
訓(xùn)練產(chǎn)生的系統(tǒng)大小約有一千兆字節(jié),隨后公司將至精簡(jiǎn)至二十兆字節(jié)。如此該系統(tǒng)可以被安裝到任何端點(diǎn)設(shè)備上,包括移動(dòng)設(shè)備。即使在最慢的機(jī)器上,它也能在幾毫秒內(nèi)完成對(duì)未知程序安全性的識(shí)別。
“檢測(cè)一兆的數(shù)據(jù)耗時(shí)不過(guò)一毫秒。” David 說(shuō)?!拔覀?cè)趯?shí)驗(yàn)室中包辦了所有復(fù)雜的準(zhǔn)備工作,用戶(hù)的使用成本非常簡(jiǎn)便?!?/p>
Deep Instinct 每三到四個(gè)月更新一次惡意軟件樣本庫(kù),新的更新隨即會(huì)被部署到正在運(yùn)行的設(shè)備上。David 稱(chēng),深度學(xué)習(xí)非常適合應(yīng)對(duì)捉摸不定的變化。即使樣本庫(kù)更新延遲,該系統(tǒng)仍然有能力檢測(cè)新的文件。
每天不斷出現(xiàn)的新型惡意軟件大多都是在舊有惡意軟件上做細(xì)小改變。“即使是最有威脅性的新惡意軟件,其80%仍然是舊的。傳統(tǒng)檢測(cè)方法對(duì)這些喬裝素手無(wú)策,但深度學(xué)習(xí)能夠很容易地檢測(cè)它們?!?/p>
David 稱(chēng)其公司正在同獨(dú)立的測(cè)試實(shí)驗(yàn)室合作量化系統(tǒng)的檢測(cè)能力。早期同財(cái)富500強(qiáng)客戶(hù)的測(cè)試顯示,該系統(tǒng)檢測(cè)成功率比現(xiàn)有解決方案高出20%~30%。
“最近我們?cè)诿绹?guó)一家大銀行做了100,000個(gè)文件的對(duì)比檢測(cè)。現(xiàn)有的解決方案在測(cè)試的當(dāng)天早上更新了樣本庫(kù),而我們的樣本庫(kù)數(shù)據(jù)還是兩個(gè)月以前的。盡如此,我們的檢測(cè)成功率達(dá)到了99.9%,而對(duì)方只有40%。”
找出原因
最新的深度學(xué)習(xí)系統(tǒng)受人指責(zé)地一點(diǎn)是,它常常能給出結(jié)果,但卻不一定能夠解釋該結(jié)果究竟如何產(chǎn)生。
對(duì)此,大數(shù)據(jù)分析服務(wù)公司 Nutonian 使用名叫 Eureqa 的 AI 引擎來(lái)嘗試解釋結(jié)果產(chǎn)生的過(guò)程。
公司創(chuàng)始人和 CTO Michael Schmidt 表示, Eureqa 能像牛頓發(fā)現(xiàn)物理學(xué)中的萬(wàn)有引力一樣,用最優(yōu)雅最簡(jiǎn)單的方式來(lái)闡述事情原委及其中關(guān)系。
公司將 Eureqa 免費(fèi)提供給研究人員使用,它已經(jīng)間接幫助后者在超過(guò)500本雜志出版物中發(fā)表研究成果。在醫(yī)學(xué)應(yīng)用中,它可以幫助診斷諸如黃斑變性和闌尾炎之類(lèi)的疾病。該引擎在網(wǎng)絡(luò)安全領(lǐng)域也有助益。網(wǎng)絡(luò)安全中,最重要的便是識(shí)別攻擊的類(lèi)型和手段,而 Eureqa 能夠自動(dòng)完成這個(gè)類(lèi)型檢測(cè)。
客戶(hù)將數(shù)據(jù)上傳到云端,服務(wù)器在一個(gè)小時(shí)之后就會(huì)傳回結(jié)果?!拔覀儸F(xiàn)已能夠在幾分鐘內(nèi)重現(xiàn)過(guò)去需要幾個(gè)月甚至幾年才能完成的結(jié)果。”Schmidt 說(shuō)。
本地與全局相結(jié)合
網(wǎng)絡(luò)安全形勢(shì)瞬息萬(wàn)變,及時(shí)的更新對(duì)任何類(lèi)型的機(jī)器學(xué)習(xí)系統(tǒng)來(lái)說(shuō)都至關(guān)重要。
如果沒(méi)有更新,再先進(jìn)的系統(tǒng)也會(huì)過(guò)時(shí)。人們總不斷弄出新的東西:?jiǎn)T工打造新產(chǎn)品,供應(yīng)商推出新程序,消費(fèi)者購(gòu)買(mǎi)新商品。當(dāng)然,黑客也會(huì)不斷編寫(xiě)出新的惡意軟件來(lái)繞過(guò)現(xiàn)有的檢測(cè)手段。
在下一次更新之前,總有漏洞存在。
別有企圖的程序員常常使用安全軟件來(lái)操練他們的攻擊手段,一旦找到有效的漏洞,那么這些安全軟件就變的形同虛設(shè)。糟糕的情況直到封堵該漏洞的更新出現(xiàn)才會(huì)結(jié)束。
“你可以使用本地模式(local patterns)、同行模式(peer patterns)和行業(yè)模式(industry-wide patterns),以不同的更新速度更新它們。”管理網(wǎng)絡(luò)公司 Masergy Communications 的首席科學(xué)家 Mike Stute 說(shuō)。
Masergy 使用一定數(shù)量的全局檢測(cè)來(lái)尋找發(fā)生可疑事件的可能性,然后將其與本地指標(biāo)相結(jié)合。全局系統(tǒng)只能檢測(cè)到有限的數(shù)據(jù),科學(xué)家們至著眼于最常見(jiàn)的特征。
額外的局部焦點(diǎn)允許更多的輸入。Stute 稱(chēng):“在本地模型中,我們不必將它們壓縮到更小的功能集?!比绱艘粊?lái)兼顧唯一性和準(zhǔn)確性。
本地與全局相結(jié)合的策略也為企業(yè)咨詢(xún)公司 Acuity Solutions 所使用,其 BluVector 便使用機(jī)器學(xué)習(xí)來(lái)檢測(cè)網(wǎng)絡(luò)威脅。BluVector 習(xí)得正常程序應(yīng)有的樣子,善于從惡意程序與正常程序的代碼差別中發(fā)現(xiàn)潛在威脅。
而且 BluVector 還會(huì)從新情況中學(xué)習(xí),不斷升級(jí)自身的鑒別能力。其主引擎與全球數(shù)據(jù)每季度同步一次,但不會(huì)涉嫌上傳客戶(hù)信息。
全局與本地的有機(jī)結(jié)合使得每個(gè)客戶(hù)的 BluVector 部署都略有不同。即使攻擊者找出了系統(tǒng)的漏洞,該攻擊手段也未必對(duì)定制化之后的系統(tǒng)有效。
“這是一種移動(dòng)防御策略,這些技術(shù)深度定制于你的環(huán)境而無(wú)法逆向破解?!盇cuity 首席執(zhí)行官Kris Lovejoy 說(shuō)。
來(lái)源:網(wǎng)易科技