近期,國防科技大學計算機學院在漏洞管理領域取得新進展。團隊面向企業和國家重點部門對高效漏洞管理的迫切需求,針對有限漏洞修復資源和不斷增加漏洞數量的突出矛盾,開展了漏洞優先級技術研究,一項最新工作“基于指針網絡和深度強化學習的漏洞優先級方法”被第13屆EAI數字取證與網絡犯罪國際會議ICDF2C 2022接收,該方法實現了對漏洞修復資源的優化配置和實時推薦漏洞優先級方案,突破了傳統優化方法的性能瓶頸,能夠適應大規模網絡和系統風險動態變化。
ICDF2C是中國計算機學會推薦的網絡與信息安全C類國際會議。
題目
VPnet: A Vulnerability Prioritization Approach Using Pointer Network and Deep Reinforcement Learning
作者
Zhoushi Sheng, Bo Yu,Chen Liang, Yongyi Zhang
主要內容
隨著信息技術蓬勃發展,互聯網資產數量與類型不斷豐富,與此同時網絡攻擊面不斷擴展,漏洞數量爆發式增長,如何確定漏洞優先級成為了高效漏洞管理的關鍵。然而傳統的漏洞管理主要依靠主觀的專家意見、靜態的漏洞嚴重性評分確定漏洞優先級,這樣的方式既缺乏聚焦真正的安全風險,也缺少對有限漏洞修復資源的優化配置,導致大量資源被消耗卻沒有帶來相應的安全效益。如何在有限的修復資源條件下最大化降低系統整體風險,并且適應大規模場景和安全風險的動態變化成為亟待解決的關鍵問題。
國防科技大學計算機學院的碩士研究生盛周石、梁晨、張永毅等人在國防科技大學研究員鐘求喜、副研究員喻波的聯合指導下,應用人工智能技術,提出了一種基于指針網絡和深度強化學習的漏洞優先級方法–VPnet。如圖1所示,VPnet首先對目標系統中的漏洞風險和修復成本進行了量化估計,并將這些特征轉化為標準的輸入矩陣,其中漏洞風險通過結合嚴重性、威脅、影響和資產重要性等因素進行量化,修復成本則根據修復建議的難易程度對漏洞所需修復時間進行估計;然后設計了一種指針網絡作為漏洞優先級方案的求解器,并提出了一種結合模仿學習與自主學習的深度強化學習算法來訓練該網絡模型參數。與傳統優化算法相比,VPnet將運算負擔轉移到了線下的訓練階段,而在應用部署時能夠實現實時推薦。
圖1 VPnet的系統架構圖
指針網絡是VPnet的核心,其結構如圖2所示,該網絡由編碼器和解碼器兩個子網絡組成:在編碼器網絡中,主要通過嵌入層和基于長短記憶單元(LSTM)的循環神經網絡對所有的漏洞信息進行編碼;在解碼器網絡中,同樣采取循環神經網絡進行解碼,其關鍵是利用了指向機制依次優先選擇漏洞進行修復,直到超出漏洞修復的總時間約束。指向機制在原理上是利用softmax函數計算出所有候選漏洞的概率分布,然后依概率選擇漏洞進行修復。
圖2 指針網絡結構圖
團隊設置了不同規模的模擬場景和一個實際的測試場景對VPnet進行測試,實驗結果顯示,在不同規模的場景下,VPnet能夠在5秒鐘內推薦出接近最優的解決方案,與最優結果的比率值均超過了95.8%;在一個實際的測試場景中,VPnet從候選的53個漏洞中推薦了9漏洞需優先修補,生成的方案相比于優化前在降低總體風險方面提升了22.8%,且時間消耗僅需1.2秒。表明VPnet能夠實現對漏洞修復資源的優化配置,且能夠適應不同規模場景和風險動態變化的需求。
圖3 不同場景下模型的性能表現
表1 測試場景的關鍵指標數據
來源:ipasslab