2016年,圖靈獎(jiǎng)得主Yann LeCun 表示,機(jī)器學(xué)習(xí)技術(shù)在未來的核心挑戰(zhàn)就是要實(shí)現(xiàn)從沒有標(biāo)簽、未經(jīng)人工處理的原始數(shù)據(jù)中學(xué)習(xí)知識(shí),即無監(jiān)督學(xué)習(xí)(unsupervised learning)。他認(rèn)為,無監(jiān)督學(xué)習(xí)一定是人工智能發(fā)展的未來。
經(jīng)過多年發(fā)展,無監(jiān)督學(xué)習(xí)技術(shù)的實(shí)際應(yīng)用能力備受業(yè)界關(guān)注,目前已在自然語言處理、視覺圖像學(xué)習(xí)等領(lǐng)域獲得較大突破。而隨著新型網(wǎng)絡(luò)威脅、攻擊與日俱增,安全研究機(jī)構(gòu)也開始嘗試?yán)脽o監(jiān)督學(xué)習(xí)技術(shù)來應(yīng)對(duì)挑戰(zhàn),特別是層出不窮的未知威脅挑戰(zhàn)。
無監(jiān)督學(xué)習(xí)的價(jià)值
無監(jiān)督學(xué)習(xí)技術(shù)屬于機(jī)器學(xué)習(xí)的一種類型,但與傳統(tǒng)機(jī)器學(xué)習(xí)模式不同的是,無監(jiān)督學(xué)習(xí)幾乎不需要對(duì)算法模型進(jìn)行人工干預(yù)的“訓(xùn)練”。乍一看,這一方法可能不合常理,因?yàn)橥ǔF髽I(yè)的思維方式是:機(jī)器學(xué)習(xí)模型只有通過反復(fù)大量的訓(xùn)練才能夠?qū)崿F(xiàn)對(duì)潛在網(wǎng)絡(luò)攻擊的有效識(shí)別和發(fā)現(xiàn);但現(xiàn)實(shí)情況是:因?yàn)槠髽I(yè)安全團(tuán)隊(duì)在構(gòu)建機(jī)器學(xué)習(xí)模型時(shí)并不能將所有可能的攻擊方法都考慮全面,因此,通過傳統(tǒng)模式訓(xùn)練構(gòu)建的機(jī)器學(xué)習(xí)模型在應(yīng)對(duì)未知威脅時(shí)作用有限,難以真正體現(xiàn)出智能化的價(jià)值。
而無監(jiān)督機(jī)器學(xué)習(xí)并不直接應(yīng)用于基于規(guī)則設(shè)定的安全回歸模型,因?yàn)樗鼰o需知道輸出值可能是什么,因此不會(huì)像傳統(tǒng)機(jī)器學(xué)習(xí)模型那樣進(jìn)行訓(xùn)練。可以這樣理解:當(dāng)我們?cè)趯W(xué)校參加考試時(shí),會(huì)有問題和標(biāo)準(zhǔn)答案;考試的成績(jī)?nèi)Q于實(shí)際回答與標(biāo)準(zhǔn)答案的接近程度。但如果沒有標(biāo)準(zhǔn)答案時(shí),我們?cè)撊绾谓o被考核者打分呢?
無監(jiān)督學(xué)習(xí)方法正是通過聚類學(xué)習(xí)、特征映射、密度估計(jì)等評(píng)估流程和智能分析技術(shù),特別是一些在人工模式學(xué)習(xí)下可能忽略的評(píng)估方式,來對(duì)那些存在隱患的威脅行為進(jìn)行識(shí)別和分析,并提醒安全團(tuán)隊(duì)留意這些可能但還未被識(shí)別的網(wǎng)絡(luò)威脅,這個(gè)過程無需通過真實(shí)的攻防演練或虛擬的攻擊場(chǎng)景來實(shí)現(xiàn),可以最大程度地實(shí)現(xiàn)自動(dòng)化,降低人為因素干擾。
企業(yè)安全人員每天面臨海量的報(bào)警信息,一些異常行為很難被發(fā)現(xiàn)或很容易被忽略,通過無監(jiān)督學(xué)習(xí)方法可以更合理地利用資源,提升效率。而且無監(jiān)督學(xué)習(xí)方法可以作為一種預(yù)防措施來避免網(wǎng)絡(luò)攻擊,能夠幫助安全團(tuán)隊(duì)更加主動(dòng)地預(yù)防威脅、實(shí)時(shí)響應(yīng)。
無監(jiān)督學(xué)習(xí)的應(yīng)用實(shí)施
作為一種應(yīng)用并不廣泛和成熟的新興技術(shù),無監(jiān)督學(xué)習(xí)在企業(yè)實(shí)際網(wǎng)絡(luò)威脅檢測(cè)場(chǎng)景下的應(yīng)用時(shí),將會(huì)面臨很多的挑戰(zhàn)和困難。經(jīng)過研究機(jī)構(gòu)的嘗試和驗(yàn)證,以下幾個(gè)步驟被認(rèn)為可以幫助企業(yè)更好地實(shí)施無監(jiān)督機(jī)器學(xué)習(xí)模型:
01
?明確無監(jiān)督學(xué)習(xí)的應(yīng)用場(chǎng)景
并非所有的網(wǎng)絡(luò)安全工作流程都適合無監(jiān)督學(xué)習(xí)模型。比如,無監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)模型在數(shù)據(jù)泄漏防護(hù)方面作用可能并不大,但在幫助安全人員發(fā)現(xiàn)未知網(wǎng)絡(luò)攻擊企圖的早期跡象時(shí)卻大有用處。企業(yè)應(yīng)仔細(xì)審查當(dāng)前的網(wǎng)絡(luò)安全策略和流程,確定可以在哪些環(huán)節(jié)使用和實(shí)施無監(jiān)督學(xué)習(xí)的模型,且不影響網(wǎng)絡(luò)安全團(tuán)隊(duì)的工作。
02
為無監(jiān)督學(xué)習(xí)方法建立成功落地的基準(zhǔn)
在讓無監(jiān)督學(xué)習(xí)模型運(yùn)行起來之前,先要確定一些基準(zhǔn)。這將幫助企業(yè)和安全團(tuán)隊(duì)了解無監(jiān)督學(xué)習(xí)模型的功能和價(jià)值,從而清楚認(rèn)知無監(jiān)督機(jī)器學(xué)習(xí)模型是為了提升安全防護(hù)而不是給企業(yè)增添額外的工作。
此外,企業(yè)需要?jiǎng)?chuàng)建一套流程來核查無監(jiān)督模型,確保模型能夠正確對(duì)數(shù)據(jù)進(jìn)行分析,當(dāng)安全團(tuán)隊(duì)能夠準(zhǔn)確掌握無監(jiān)督學(xué)習(xí)方法實(shí)施后的成果與問題時(shí),就能夠根據(jù)需求對(duì)其進(jìn)行適當(dāng)調(diào)整。
03
及時(shí)做好應(yīng)用效果監(jiān)控和報(bào)告
無監(jiān)督學(xué)習(xí)方法的機(jī)器模型經(jīng)過對(duì)網(wǎng)絡(luò)威脅和檢測(cè)網(wǎng)絡(luò)攻擊的訓(xùn)練后,對(duì)安全風(fēng)險(xiǎn)監(jiān)測(cè)報(bào)告的處理就是保證企業(yè)網(wǎng)絡(luò)安全的下一個(gè)關(guān)鍵步驟。
無監(jiān)督學(xué)習(xí)方法雖然對(duì)未知威脅風(fēng)險(xiǎn)監(jiān)測(cè)很有價(jià)值,但仍然難以避免數(shù)據(jù)錯(cuò)誤分析并誤報(bào)的可能。使用無監(jiān)督學(xué)習(xí)方法訓(xùn)練的人工智能模型,需要對(duì)海量未經(jīng)處理的原始數(shù)據(jù)進(jìn)行準(zhǔn)確分類和聚類處理,因此必須要建立一個(gè)檢測(cè)流程來糾正過程中可能發(fā)生的錯(cuò)誤。
當(dāng)人工智能模型將企業(yè)內(nèi)部的安全防護(hù)模塊妥善的串聯(lián)在一起之后,人工的監(jiān)控依舊不能松懈,因?yàn)橥ㄟ^人類的智慧對(duì)網(wǎng)絡(luò)安全風(fēng)險(xiǎn)進(jìn)行判斷把關(guān),依舊是網(wǎng)絡(luò)安全防護(hù)的最重要組成部分,這是人工智能無法替代的。
參考鏈接
https://dzone.com/articles/using-unsupervised-learning-to-combat-cyber-threat