AI驅動安全,10年前就曾經是一個熱門話題;23年在LLM的推動下,又重新掀起了一番熱潮。 回望過往,國內網安行業曾經在AI技術上全球領先,而如今我們看到確實另一個景象,就如CrowdStrike憑借AI能力構建的終端防御能力已經全方位超越傳統安全技術,彼此之間已經是質的差別。
當前LLM的浪潮,對于安全企業是機會也是陷阱。抓住機會就能夠脫穎而出,掉入陷阱就不僅浪費了資源,也是浪費了時間。結合過往的經歷以及當下領先公司的現狀,發現有兩類問題是投入AI技術方向是最容易出問題的地方:
下面就以Crowdstrike為例展開談談對這兩個問題的理解。
即使不考慮當前大火的LLM,AI在網絡安全中的應用場景已經非常廣泛,可以說在網絡安全中的任何一個環節,都可以利用AI來嘗試解決問題。下圖就是整合不同廠商、安全機構形成的一個比較全的全景圖畫:
也就是說AI在網絡安全中的應用場景,至少可以達到數十種之多。 數目雖然眾多,但是每個場景本身的價值不同、場景中已有技術存在的問題不同、AI可以解決的問題的程度也是不同的,需要基于這三個因素來衡量哪些是值得優先投入的。
于很多人的直覺相反,Crowdstrike選擇的關鍵場景不是EDR、而是AV,也就是一般說的惡意軟件防御。從當前看到的公開資料,可以認為CrowdStrike在AI領域的絕大多數投資以及技術進展,均來自于惡意軟件防御領域。下面從三個因素出發看看它為何會做這樣的選擇:
CrowdStrike正是因為做好了基于AI模型的惡意軟件防御,才能在大客戶市場和微軟這樣捆綁銷售的高手較量并且勝出,同樣可以在中小客戶市場去替代Mcafee、賽門鐵克、趨勢等傳統AV市場的龍頭。
大方向的正確是成功的前提,但還遠遠不夠。對于CrowdStrike而言,如何在AI技術的驅動下,真正取得遠超傳統AV廠商的安全效果是一個更大的挑戰。網絡安全中對AI有一定了解的人都知道,使用AI的方法存在多種挑戰需要解決,誤報率、漏報率和可解釋性是其中最關鍵的部分。
漏報/誤報問題
從本質上講,誤報和漏報是一體的,在沒有足夠多維度信息做充分條件判斷時,就需要在誤報和漏報中間尋找平衡點;另一個問題在于攻擊者往往會發明新的攻擊技戰術方法,客戶的業務環境也可能隨著數字化進展而不斷變化,這也會造成檢測能力上的挑戰。Crowdstrike使用了數種方法來應對挑戰:
Crowdstrike 通過靜態+行為+上下文方式引入更多的分析維度;通過必要的人工運營介入保障少量、高質量的訓練數據;并且通過威脅狩獵等專家手段不斷發現模型的不足之處,使其在AI對抗惡意軟件方向上遙遙領先于其他廠商。其公司總結其經驗稱——CrowdStrike的重點不只是精選數據及訓練最佳模型,而是創建收集數據并生成高質量模型的流程,并以自動化方式執行此操作 。
可解釋性
可解釋性上Crowdstrike的做法曾經被多次分析過,它融合了幾種不同的解釋方法,以滿足各種檢出情況、各種相關人員的需要:
通過整合這三種可解釋性信息,其NGAV在可解釋性上不但不弱于傳統基于規則的AV廠商,而是極大程度的超出了。
綜上,CrowdStrike的成功更多是其從系統的角度去看待AI技術,而不是單獨依賴AI做一個功能模塊,也沒有將AI模型開發等同與傳統的軟件功能開發。它更重視通過多種技術的融合達到更好的安全效果,更注重整體能力運營流程的搭建以及自動化,而這些是很多廠商容易忽視的地方。
上面的認識都是基于傳統AI技術的應用形成的,并不涉及LLM領域。在過去一年中,已經看到LLM在很多ToB應用上也取得了明顯的進展:
網絡安全中LLM注定也要發揮重要作用,但當前的進展看似都還不明顯。也許2024年能夠看到更多。其中關鍵的場景會在哪里——代碼理解能力帶來的惡意腳本分析能力?交互形式改變帶來的培訓、使用成本降低?亦或是數據總結/標記能力帶來的更自動化的數據分類分級…….
但無論如何,它應該是一個普遍場景下的關鍵難點,同時詳細在具體解決問題我們依賴的也不僅僅是大模型技術本身。讓后續的發展來驗證這兩個關鍵點是否還依然有效吧。
來源:ZenMind