五月下旬,網絡安全行業非常關注的一本書在亞馬遜公開上架發售,那就是三屆普利策獎得主和《紐約時報》暢銷書作者巴頓·蓋爾曼采訪愛德華·斯諾登(Edward Snowden)的新書:《黑鏡》(注意,不要跟同名美劇搞混),再次爆料美國國家安全局對全球社交圖譜的監控和分析“黑科技”。
今年初斯諾登公開了《永久記錄》的未刪減版本,數月后訪談記錄《黑鏡》上架,根據目前的讀者反饋來看,《黑鏡》難能可貴的是沒有炒冷飯,依然誠意滿滿,爆料了大量此前未曾披露的信息。
在《永久記錄》中,斯諾登揭露了NSA的電話記錄跟蹤程序。而《黑鏡》則進一步揭示了過去幾年中,NSA如何通過“預先計算的聯系鏈”,使其監控數據庫的功能比以往任何時候都更加強大。
以下是安全牛對《黑鏡》部分報道內容的編譯摘錄,方便大家對該書的背景和內容有個大致的了解和判斷:
在2013年的一個夏天,斯諾登花了很多時間梳理來自美國記者手中的大量絕密文件存檔,并向專欄作家格倫·格林瓦爾德(Glenn Greenwald)和紀錄片制片人勞拉·普伊特拉斯(Laura Poitras)發送了成千上萬份機密文件。
其中一份文件于2013年6月首次公開,顯示NSA正在追蹤美國人在美國境內進行的數十億電話通話。該程序臭名昭著,但其背后完整的故事并未被披露。
冰山的水下部分
最初的爆料只揭示了冰山一角:如果你撥打了本地或國際電話,則NSA將存儲你撥打的號碼以及電話的日期、時間和持續時間。這就是所謂的“家庭監視”,簡單明了。事情敗露后,NSA否認侵犯隱私權,聲稱僅收集了“元數據”,而不是電話的內容本身。NSA說,僅在極少數情況下,它才在記錄中搜索恐怖分子之間的通訊內容。
斯諾登決定進一步深入研究,因為上次爆料后的全球公開辯論漏掉了很多重要信息。一開始斯諾登并不了解這些記錄的樣子,認為只是一些簡單的數據列表。斯諾登還以為NSA清理了這些列表(包含呼叫日期、通話時長等信息),并將其轉換為該機構首選的“Atomic Sigint數據格式”,束之高閣。但在斯諾登首次披露情報后六周,波士頓馬拉松爆炸案發三個月后,當年7月的阿斯彭安全論壇(Aspen Security Forum)上的一次對話中,前國家情報總監登尼斯·布萊爾上將向斯諾登保證,這些記錄是“存起來的”,沒有被改動,直到接下來的波士頓爆炸案(才再次被啟用)。
法律專家保羅·歐姆(Paul Ohm)將NSA手里的海量信息形容為“毀滅性數據庫”。它持有的個人機密“如果被揭露/泄露,不僅會造成尷尬或恥辱,還將導致嚴重的、實質性的、破壞性的傷害?!?他寫道,幾乎發達國家中的任何人都可以與計算機數據庫中的至少一個事實建立聯系,攻擊者可以利用該事實進行勒索、歧視、騷擾或進行財務/身份盜竊?!崩纾皩^去的不良行為、健康或家庭糗事”的揭露可能會導致一個人的婚姻、職業、合法居所或人身安全蒙受損失。
僅僅創建一個這樣的數據庫,尤其是秘密地創建數據庫,就深刻地改變了政府與被統治者之間的權力平衡。這就是所謂的黑鏡,玻璃的一面是透明的,另一面是黑色的。而且,更可怕的是這面黑鏡并不總是黑的一面朝向個人,試想一下:如果一小部分公民可以秘密訪問政府官員的電話記錄和社交網絡,該怎么辦?特權知識分子如何利用黑鏡去左右權力改變事件的走向?如果他們擁有羞辱和破壞當權者職業的手段,他們之間的互動將如何改變?無論是否使用,黑鏡的魔力依然是一種絕對的存在,未開火的槍依然是致命武器。這些武器級的數據庫,就像核彈頭一樣碼放在政府的軍械庫中。
斯諾登認為這些擔憂不是假設,而是實實在在的隱患。2013年9月,斯諾登突然意識到還有一些未來得及充分探討的具體問題。例如,電話記錄存放在NSA的內部何處?被如何處理?斯諾登檔案沒有直接回答這些問題,但留下了線索。
9月下旬,斯諾登偶然發現了第一個線索:NSA內部討論的全面大規?!芭渴占保╞ulk collection)引起了斯諾登的興趣。電話記錄只是被采集的多種數據類型之一。NSA在發現和攝取他人的全部信息方面已經變得越來越嫻熟,甚至富有創造力。但是最近,NSA開始發現它消耗了太多東西,以致無法消化。中層管理人員和工程師在為他們的指揮系統準備的簡報中發出了警告。一個演講PPT的封面問道:“這是SIGINT的終結嗎?” 顯然,情報采集和監視的基礎設施的工作壓力已經很大。
一張圖表中的一個名詞吸引了斯諾登,這張圖表列出了風險最高的系統:Mainway。該系統由NSA的工程師在2001年911事件后著手緊急開發。時任副總統切尼的辦公室起草了由喬治·W·布什總統簽署的命令,啟動這項 “違法”工作:追蹤美國境內的美國人撥打和接聽的電話。Mainway行動是我們現在所看到的更廣泛,更變本加厲的不合法行為的前兆。
在“基地”組織劫持飛機撞擊世貿中心和五角大樓后的瘋狂的幾周,切尼辦公室內制定了一項國內監視計劃Stellarwind,Mainway則是實現它的工具。
當時,NSA知道如何監控國外電話,但是還沒有在本土實施的設備。
當國家安全局局長邁克·海頓(Mike Hayden)于2001年10月4日收到副總統切尼的Stellarwind特別計劃的執行命令時,國家安全局的工程師在幾天之內用裸機組裝了一個系統,并借用了代碼,這在壓力之下是一項了不起的成就。他們“截胡”了戴爾發給客戶的50臺最先進的服務器,整合到一個“快速,骯臟但功能強大的集群”中。Hayden清理了OPS 2B大樓壁壘森嚴的翼樓中的空房間,OPS 2B是NSA馬里蘭州米德堡閃閃發光的總部大樓的內部圣殿。該計算機集群進一步擴展,整合了約200臺機器,Mainway系統甚至還擴張到了Tordella超級計算機設施的一個節點。同年10月6日至7日,Mainway開始召集一小批分析師,程序員和數學家。
在10月8日哥倫布日(Columbus Day)上,海登(Hayden)在專門劃分的新業務部門中向招募來的專家們介紹了他們的新工作——“Starburst”。之后,Stellarwind取代了Starburst這個名字。在同一個假日周末,海頓派遣了特種資源運營部的人員,與AT&T和Verizon等公司秘密商討購買大量電話數據的秘密。在之后的五年中,這一“采購”的金額將超過1.02億美元。
Stellarwind項目不可能逃過其他NSA工作人員的眼睛,因為他們看到新裝備以瘋狂的速度在武裝護送下到達,但幾乎沒人知道具體發生了什么。Stellarwind項目的代號被指定為ECI,即“例外控制信息”,是所有信息中最嚴格的保密分類。副總統切尼在他的西翼辦公室下令,Stellarwind項目需要對FISA法院法官和國會情報委員會保密。
根據斯諾登的消息來源和2013年秋天研究過的文件,Mainway隨后很快成為了NSA繪制社交網絡的最重要工具-該機構稱為大型訪問利用的錨點。在米德堡,“大”不是隨意使用的形容詞。Mainway專為超大規模運營而設計。
元數據才是王道:全民畫像
NSA其他系統負責解析截獲的通信的內容:語音、視頻、電子郵件和聊天文本、附件、尋呼機消息等。而Mainway是處理元數據(國內外元數據)的王者,旨在查找內容無法揭示的模式和關聯。除此之外,Mainway是更雄心勃勃的計劃的原型。該原型的規劃者寫道,下一代系統的側重點將從“已收集信息的處理,向收集何種信息”轉移,來進一步提高監控能力。例如,從通話記錄中收集的模式將有助于從電子郵件或位置數據庫中識別目標,反之亦然。
元數據是NSA計劃“識別、跟蹤、存儲、操縱和更新所有形式的被攔截內容之間的關系”的關鍵。通過可視化的集成地圖,NSA能夠在全球范圍內鎖定顯示幾乎任何人的活動和通訊。在他們的第一個任務聲明中,計劃人員給該項目取了個直白的名字“ Big Awesome Graph”,縮寫為“ BAG”(口袋)。這個“口袋”最終將使NSA能夠在全球范圍跟蹤任何人。
關于這個問題的關鍵發現出現在2012年準備的一張大型網絡圖的右下角(下圖)。這個示意圖終于回答了NSA將海量電話記錄存放在哪里的問題,這些記錄存儲都在Mainway系統中,威力驚人。
整個網絡流程圖太大了,無法完整顯示,該圖追蹤了來自AT&T的“計費元數據流”如何沿著迷宮般的網絡圖譜流進了NSA總部邁德堡的“口袋”——Mainway。數據進入Mainway前的最后一站MAILLORDER是一種文件分類和轉發系統,扮演著電子交通警察的角色。網絡圖中的“ BRF分區”是根據Business Records FISA訂單命名的,其中有12項是在2009年簽署的,將數千億次電話通話記錄注入了Mainway。
對于首次看到這張網絡地圖的讀者,可能會把標注Mainway的圓柱形圖標誤解為存儲器。實際上圓柱體是數據庫的標準符號,Mainway并不是存放靜態數據的容器。在NSA它們被稱為數據集市和數據倉庫。如果該機構僅存儲美國電話記錄,則將其留在名為Fascia II的系統中,該系統是為Mainway提供服務的“呼叫詳細記錄倉庫”。Mainway在其第一財年提出的任務是“使NSA …主導全球通信基礎設施,以及在其中匿名運行的目標。”系統完成任務的方式對美國人的隱私具有重大影響。
下面是Mainway在SSO詞典(一個保密的NSA參考文檔)的解釋條目:
(TS // SI // REL)Mainway或Mainway預先計算的聯系人鏈接服務(Mainway Precomputed Contact Chaining Service)是一種用于聯系人鏈接的分析工具。它使分析師能夠快速,輕松地查詢日益增長的全球通信元數據,更快發現目標。Mainway解決了分析全球通信網絡的數據規模過大問題。
在這個簡短的詞條介紹中有三個值得注意的術語:規模問題、關系鏈和預先計算。最后兩個結合起來,顛覆了我們對通話記錄程序的理解,但在此之前,請先注意一下規模問題。
實際上,NSA面臨各種規模性的挑戰。太多的信息在全球網絡之間高速移動,NSA攝取過多,存儲太多,太多的噪音淹沒了太少的有價值信號。但是,在我剛才引用的段落中,規模問題還涉及到其他問題,即監控機器內部的問題,也就是NSA“食欲不振”的一種表現。收集系統“貪多嚼不爛”,問題出在處理而不是存儲環節。
長期以來,情報官員通過引用布什總統的話來解釋通話記錄數據庫的使用方式。布什說:“在我看來,如果有人在與基地組織談話,我們想知道為什么?!?/p>
實際上,這完全不是NSA使用電話記錄的方式。該程序旨在找出任何與恐怖主義有聯系的人,而不是為了查明原因,因此,這個程序事實上搜查了所有美國人。通過FBI,NSA通過其可以染指的每個帳戶收集了五年的電話清單。數以萬億計的電話記錄。在壞人的電話賬單上查找號碼可不需要整這么大動靜。
這就是聯系鏈(contact chaining)的來源,該短語用于描述一種在非常大的數據集中查找隱藏的關系的極為復雜的分析形式。聯系鏈分析從目標電話號碼開始,例如波士頓炸彈襲擊者Dzhokhar Tsarnaev的電話,并逐漸擴大范圍,以查詢Tsarnaev的聯系人正在與誰交談,以及這些人正在與誰交談等等。
軟件工具將呼叫記錄映射為網格上的“節點”和“邊緣”,網格太大,超出了人腦的想象空間。節點是地圖上的點,每個點代表一個電話號碼。邊緣是在節點之間繪制的線,每條線代表一個通話。一個名為MapReduce的大數據分析工具將數萬億個數據點濃縮為人類分析師可以掌握的摘要形式。
社交圖譜
網絡理論將社交地圖稱為社交圖譜(social graph)。它為定義每個人與世界互動的關系和群體建模。圖的大小隨著聯系鏈接的發展而呈指數增長。鏈接的全部目的是從目標的直接聯系人向外推到聯系人的聯系人,然后再向外推導。該過程中的每個步驟都稱為躍點,躍點的層級數越多,社交圖譜的人口規模將呈幾何級數增長。
國家安全局前副局長約翰·英格里斯(John C. Inglis)在2013年向國會作證說,國家安全局分析師通常分析呼叫數據的深度只有“兩三跳“。作為背景知識,數據科學家幾十年前估計,跟蹤地球上任何兩個人之間的路徑所用的跳數都不會超過六跳(六度空間理論)。
學術研究表明,平均三跳就可以追蹤到任何兩個美國人之間的路徑。
但即使是Mainway這樣強悍的系統,要分析整個美國的電話記錄依然是一項極為艱巨的計算任務。每當Mainway的運營商要求建立新的聯系鏈時,Mainway必須在時間壓力下按需生成該地圖。沒有人能預測下一個領導者的名字或電話號碼。從數據科學家的角度來看,邏輯上的補救辦法是明確的。如果任何人都可以成為情報目標,那么Mainway應該嘗試搶先一步,給所有人“畫像”。
“您必須建立所有這些關系,并對其進行標記,以便在啟動查詢時可以快速獲取它們?!睅啄昵埃瑖野踩智案本珠L里克·萊奇特(Rick Ledgett)透露?!胺駝t,您要花一個月的時間瀏覽一份專線專用的電話賬單?!蹦蔷褪菫槭裁匆腩A計算, Mainway7x24小時不停歇地關聯其數據庫信息”。
Mainway的工作永無止境。因為它試圖索引的這本書,永遠是不完整的。聯邦調查局每天通過電話公司為國家安全局輸送的新電話記錄超過10億條。Mainway必須每天再“吃下”這10億條數據,以符合FISA法院對通話信息保留5年的限制。每次新數據引入都會通過社交圖表進行級聯,重新繪制地圖并迫使Mainway不斷更新。
換句話說,Mainway的目的既不是存儲也不是準備簡單數據列表,而是進行持續,復雜和高強度的運算,為另一個稱為“內存圖譜計算”(Graph-in-Memory)的數據庫提供資源。
2013年4月,波士頓馬拉松炸彈爆炸時,“內存圖譜計算”已經準備就緒。在FBI開始調查之前,Mainway已經掌握了嫌犯Tsarnaev兄弟的電話聯系人圖譜,包括基本的細節(日期、時間、持續時間、忙音、未接來電和“呼叫等待事件”)可供輕松按需檢索。Mainway已經提前處理了它們。借助第一跳的預先計算,內存中預計算的關系圖譜可以更快地完成第二和第三跳的工作。
當斯諾登在2013年秋天解析文檔并采訪了消息來源時,其含義終于浮現了。美國國家安全局(NSA)建立了一個實時的,不斷更新的美國社交圖譜。
事實是,美國人的電話記錄沒有被冷存儲,這些數據沒有閑著,它們被編排在每個人的一跳接觸鏈中。社交、醫療、政治、專業等所有秘密均已被7×24預先計算。這是一個預先配置好的數據庫,只需按一下按鈕就調出任何一個人的“畫像”。
斯諾登表示,沒有理由相信美國國家安全局(NSA)濫用了美國人生活的實時地圖。即使布什的總檢察長邁克爾·穆卡西(Michael Mukasey)越過了邊界,該規則仍對美國電話記錄的使用施加了一些限制。根據隱私和公民自由監督委員會的說法,只有22位高級官員有權下令根據Mainway的FISA分區中的數據建立聯系鏈。
但是,斯諾登指出,歷史上沒有人相信政府的行為總是遵循規則,或者規則永遠不會以危險的方式改變。在記憶中,理查德·尼克松下令竊聽他的政治敵人。聯邦調查局將小馬丁·路德·金(Martin Luther King Jr.)判定為“危險而有效的黑人”,并利用秘密監視記錄了他的性關系。
斯諾登指出,濫用監視的情況最近也時有發生。FBI非法部署了數百個沒有逮捕證的GPS跟蹤設備。紐約警方系統地監視了清真寺。各級政府最大程度地使用國家權力,有時甚至是非法使用國家權力,監視因貧困、種族、宗教、種族和移民地位而處于不利地位的社區。作為總統候選人,唐納德·特朗普明確威脅要把他反對的候選人入獄。上任后,他宣稱擁有控制任何政府機構的絕對權利。特朗普還向司法部公開和私下施加了巨大的壓力,要求對批評者進行刑事調查。
以上內容摘編自斯諾登新作《黑鏡》,由企鵝出版社(Penguin Publishing Group,Penguin Random House LLC的子公司)出版。