元數據殺人?我們已被網絡空間綁架

摘要: 政府情報機構和企業通常會在人們不知情或說無需通過人們同意的情況下,對公民在網絡空間中留下的海量數據進行存儲和分析。基於這些數據,他們可以知道人們不同意或反對什麼,而這些想法和行動對人們的生活有着深遠的影響。

政府情報機構和企業通常會在人們不知情或說無需通過人們同意的情況下,對公民在網絡空間中留下的海量數據進行存儲和分析。基於這些數據,他們可以知道人們不同意或反對什麼,而這些想法和行動對人們的生活有着深遠的影響。雖然大家並不情願,但事實是我們處於大規模監控之下,至少,美國公民的確是這樣。


元數據的真面目


絕大部分人對美國國家安全局(NSA)的瞭解,要歸功於愛德華·斯諾登。作爲NSA的項目承包商,斯諾登收集了NSA有關監控活動的成千上萬份文檔,並於2013年逃到香港把資料交給經過他慎重選擇的記者。


這些文檔曝出的第一個故事就是收集所有美國公民的手機電話撥打記錄,注意,只是撥打記錄。據此,美國政府就一直以“撥打記錄”爲辯護說詞,說是他們收集的“只是元數據“。也就是說,NSA並沒有收集電話的談話內容,只是收集了接打雙方的電話號碼,以及撥打電話的日期、時間和時長。


元數據(Metadata),儘管大多數人並不確切地知道它意味着什麼,但聽上去似乎能給人帶來一定的安撫作用。但實際上,收集元數據同樣屬於赤裸裸的監控。


比如,國外電影中經常有僱傭私人偵探竊聽某人的情節。請注意,這裏的用詞是“竊聽”。私人偵探接收委託後,會在被監視人的家中、辦公室和汽車中裝上竊聽器,偷聽電話內容、查看計算機。然後,委託人會收到一份被監聽者的詳細談話內容報告。


如果把委託任務從“竊聽”變爲“監視”呢?最後委託人收到的報告內容肯定有所變化,但範圍卻更廣了。監視包括,被監視人的行蹤去向,幹了什麼事,與誰談話並談了多長時間,與誰通信,閱讀什麼,購買什麼等等。這些信息就是“元數據”。簡而言之,竊聽可以得到談話內容,監視則包含所有其他的背景或相關信息。


元數據是描述數據屬性的集合,是對數據的說明,比如,數據的類型、名稱、字段等。


電話元數據還可以透露更多的信息。比如,根據談話的時機、長度和頻率,能推算出談話人彼此之間的關係。是密友,商業夥伴,還是其他什麼人。電話元數據顯示被監視人對誰感興趣,什麼對他是重要的,不管這些信息有多麼私密。它是窺探人們個性的窗口,它能夠在任何時間點繪製出被監視人的事件報告。


有些人覺得不以爲然,這些所謂的元數據能有什麼嚴重的隱私問題,是不是有點大驚小怪了?


好,我們來看看美國斯坦福大學做過的一項分析電話元數據的實驗,這次實驗在幾個月的時間裏收集了500個志願者的元數據。


  1. 志願者A與多個地方的神經病學小組有聯繫,聯繫過一家專項藥房,一個罕見病症管理服務機構,以及一條藥品熱線,該熱線只用來諮詢多發性硬化症的復發。

  2. 志願者B與一個大型醫療中心的心臟病專家詳談,還與一個醫療實驗室有過簡短會話,接過藥房打來的電話,並接通過一個家用醫療設備的熱線,該設備用於監視心率失常。

  3. 志願者C給一家專門售賣AR半自動步槍的槍支商店打過不少次電話,而且還與AR步槍的生產商客戶服務詳談過。

  4. 志願者D一連三個星期與家居改善店、鎖匠、水栽經銷商和菸草用品商店聯繫。

  5. 志願者E在一個早晨與她的姐姐通了很長時間的話。兩天後,她給當地的計劃生育機構打了許多電話,兩週後又打了幾個,一個月後打了最後一個電話。


這五個志願者的元數據代表着什麼呢?


一個多發性硬化症患者,一個心臟病患者,一個半自動武器持有者,一個家庭大麻種植者,最後是一個做流產的母親。


搜索引擎的殺傷力


下面我們再來看看網頁搜索數據,它是另一種NSA用於大規模監視公民行爲的私密數據。有人認爲網頁搜索數據不能算是元數據,但NSA認爲是,理由是搜索詞是嵌入在網址中的。(話說這算哪門子理由?)


之所以說搜索數據是私密的,是因爲人們不會對搜索引擎撒謊,這些數據甚至比朋友、情人或是家人更與自身緊密和貼切,因爲我們總是儘可能準確的告訴搜索引擎,我們在想什麼。


谷歌知道每一個人搜索的色情網站,知道人們內心深處的擔心和祕密,甚至是恥辱和罪惡。如果谷歌想知道某一個網民心裏面正在想什麼,它就能知道,不管你是在想逃稅還是計劃抗議政府的某項方針政策。曾經有人說,谷歌比自己的妻子還了解自己。但實際上還可以更進一步,應該說谷歌比你自己還了解自己,因爲它能毫無改變地、永遠地記住你曾經在那個長條框裏輸進去的東西,不管它是什麼。


現在,我們來用谷歌的自動完成功能做一個實驗(由於工作原因,筆者很少用百度)。這個功能可以實時的把你想要查詢的問題補充完整。當我鍵入“should i tell my w”的時候,搜索框自動會出現以下幾個結果:


should i tell my wife i cheated(我應該告訴我妻子我出軌了嗎)

should i tell my wife about emotional affair (我應該告訴我妻子我有外遇了嗎)

should i tell my wife i filed for divorce(我應該告訴我妻子我提交離婚申請了嗎)

should i tell my wife i’m in love with another woman(我應該告訴我妻子我愛上另一個女人了嗎)


0

這些自動完成的內容,全部基於其他人的輸入。谷歌知道誰點擊了哪一個自動完成的內容,以及所有他們在搜索的東西。谷歌CEO施密特曾在2010年這樣說道:“我們知道你在哪兒,知道你去過哪兒。我們或多或少的知道你在想什麼。”


如果你有谷歌賬號,你可以在搜索歷史中查一下,不會讓你失望的——年月日精確到分,你都搜索過什麼,它都幫你記得一清二楚。


記得有一次,我忘記哪一天去的某個場所,但我記得出去前用過谷歌搜索了這個場所的簡介,於是我登錄谷歌,輕而易舉的把那一天的日期找到。我饒有興趣往前翻,發現自從我註冊谷歌以來,已經被記錄了1萬多次搜索記錄,從衣食住行到生病、學習、娛樂、睡覺,應有盡有。我沒有寫日記的習慣,但我想,對於互聯網人來說,這些搜索記錄絕對比日記要日記的多!(PS:我可不會告訴你,百度也一樣。)

0


好吧,2011年我迷過一陣電吉他


元數據可以殺人


還有很多其他的私密數據和元數據的來源。你的網上購物記錄會透露你大量的習慣,你的微博會告訴全世界你何時起牀吃早餐,何時道晚安睡覺。你的朋友圈和聯繫人會暴露你的政治傾向,甚至是性取向。你的電子郵件或你的短信息可以顯露誰是你職業、社交和個人感情生活的中心,你手機上的APP可以定位你的位置,去過哪裏……


數據與元數據可以這樣來區別,前者是內容,後者是背景。背景常常比內容顯示更多的信息,尤其是把元數據集合起來的時候。當你監視一個人的某次具體行動時,他的談話內容、手機短信和電子郵件的確比元數據重要。但當你監視一個人的生活,或是大面積區域人口的時候,元數據的作用就無可比擬了。無論是重要性、實用性,還是對問題的判斷和預示上,都極有意義。


“元數據絕對可以告訴你某個人其生活的一切事情。如果你有足夠多的元數據,你就不需要數據內容。”

——美國國家安全局前法律總顧問斯圖爾特·貝克爾


就在去年,前美國中央情報局和國家安全局局長邁克爾·海登曾在一次公開的會議討論中說過一句令人瞠目的話:


“我們基於元數據殺人。”


接着他爲了減緩這句話給人帶來的震驚,又補充了一句:


“但我們收集元數據的目的不是用來殺人。”


0

邁克爾·海登


本文無意去探討“元數據殺人”的真正含義和背後故事,但本文至少可以看出美國情報機構打着元數據的旗號,卻幹着嚴重威脅公民隱私的勾當。君不見,美國參議院以罕見的神速通過《網絡空間安全信息共享法》方案了嗎?票數是14:1。

.


點擊打開鏈接

發佈了0 篇原創文章 · 獲贊 0 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章