你的生活正處於智能手機的監聽之下嗎?文中有答案!

你有沒有過這樣的經歷,纔剛剛和朋友談論過的東西,下一秒,它的廣告就出現在你的手機裏。

有的時候這種情況很好解釋。一個近期要結婚的同事告訴我,她從來沒有在網上搜索過婚紗,但搜索引擎卻開始給她瘋狂推薦各種款式。結婚三個月之後,儘管她沒有生寶寶的計劃,和新生兒相關的各種產品卻出現在了她的搜索推薦裏。顯然這個故事裏不存在什麼謎團,和陰謀論也並不沾邊。但其他的情況就很可疑了。我們來舉個例子,你之前從來沒有在戶外燒烤過,有一天你口頭提到了這個想法,緊接着,你就看到了燒烤器具的廣告。這真的只是巧合嗎?

 

 

在聽過了類似的故事或有了相似的經歷之後,很多人逐漸相信互聯網巨頭們的確躲在我們的智能手機背後監聽着我們的生活。這到底是真實還是假想?讓我們暫時擱置這個問題,先自己動手做一個實驗。

 

告訴你的手機一些它預測不到的事

 

接下來請你和朋友們聚在一起,將手機放在桌上,開動腦筋談論一些你們之前從未想過的東西。嘗試閱讀以下文字:


“ 你知道囦流(水流)控zんì(控制)係統(系統)嗎?我總想要買一個囦流控zんì係統,要是能找到物美價廉的囦流控zんì係統,我絕對要買一個。”

我們故意用火星文打出這裏的關鍵詞,讓智能手機無法直接從文本中識別它,你的語音信息將是搜索引擎能夠獲取這個關鍵詞的唯一方式。

千萬記得別在這個時候提起你真的想要買的東西,開發你們的腦洞想想那些這輩子都用不着的事物,像是軍用帳篷或者水豚之類的。

 

另外還要注意,在任何情況下都不要搜索實驗所用的關鍵詞,也不要在語音助手開啓時提及關鍵詞,這將會破壞整個實驗的結果。

在你和朋友閒聊結束後的一週內,記得要時不時提起那個奇怪的關鍵詞,像是“啊我還在想要不要去買一個囦流控zんì係統……”

 

我和同事們一起做了這個實驗,請在文末查看實驗結果。

 

廣告推薦只是一個奇妙的巧合?

 

現在我們回到事實還是假想的問題上來。的確還是存在一些不涉及使用麥克風監聽的陰謀論,就能夠解釋搜索引擎爲何意外爲我們推薦了正確產品的理論。

01

互聯網服務建立了正確模型

在《你的手機並沒有在聽你說話——事實真相可能更聳人聽聞》一文中,一位前谷歌僱員告訴我們,谷歌和臉書基本上爲每個用戶建立了電子畫像,嘗試藉助機器學習的方法複製你的行爲。一旦數據積累到一定程度,你的電子畫像就會變得和你一樣,甚至能夠開始預測你想要什麼。

 

 

至於臉書,我聽說它甚至能通過一個人刷新社交網絡信息流的頻率,在孕婦知道自己懷孕之前就判斷出她是否懷孕。

從個人角度,我拒絕相信這種近乎於心電感應的預測能力,但這種解釋中也包含了一定的事實。機器學習一直在不斷髮展,攻克技術難關,再創新高。青松智能WAF的行爲模型就是一種採用了類似技術的威脅探測方法。它的基本原理是,如果一個請求很像已知的某種惡意攻擊,那很大程度上它就是惡意攻擊。

02

我們不小心開啓了語音助手 

另一個能夠說明搜索引擎無所不知的解釋是,我們不小心開啓了語音助手。有的時候我們明明沒有試圖喚醒它們,但手機卻認爲它聽到了“Alexa”“OK Google”“嘿 Siri”“你好小娜”等激活指令。

我們並不需要發音有多標準才能喚醒它們,很多時候相似的發音就足以開啓語音助手,接下來的事情就很顯然了,它們的確聽到了我們說的話,並開始推薦相關的搜索內容。

 

 

在待機狀態下,即使是獨立的語音助手(比方說智能音響內的語音助手)也不會持續捕捉你的對話,它們總是在等待喚醒。智能設備利用小型緩衝區(能夠儲存幾秒語音數據)、專用處理器和對某一特定詞彙的語音識別算法捕捉開啓指令。

語音助手大部分時間都是以低功耗且不產生網絡流量的待機模式運行。只有在它探測到觸發詞後纔會完全被喚醒,連接到服務器並傳輸識別語音信息。

 

03

劃分用戶族羣 

我們假設你曾和自己的朋友或家人討論止汗露或其他的一些東西,之後你並沒有搜索它,但其他人搜索了。這種情況下,你再看到止汗露廣告的話,就不要覺得太過驚訝了。

或者換個場景,作爲男生的你,淘寶上卻經常收到女裝、女士用品的推送!在確定你自己沒有搜索過的前提下,很有可能是你的室友在網絡上查詢了它。

 

產生這一現實的原因是,如果你們經常在同一個地方,用同一個WiFi網絡,甚至可能一直在同一個設備上輪流登陸賬號,那麼互聯網服務會認爲你們這兩個賬號之間存在一定的關聯。這樣的用戶很有可能是共同作出購買決策的,因此會被搜索引擎分到同一個族羣裏,併爲他們推薦相同的產品。

 

我們不能肯定地說這就是真實發生的情況,但這種對於互聯網服務的猜測的確是符合邏輯的。

 

04

他們只是意外猜中了而已

我經常會看到一些完全不感興趣的廣告,什麼桑拿設施、孕檢、各種旅遊目的地等等,你很可能也見過類似的廣告。

每天都有數億人在使用搜索引擎,所以從概率上來說,某一天你和朋友剛聊完汗蒸的好處就看到了相關的廣告也是完全有可能的。你會把這件事發到網上說你的手機在監視你,而其他同樣看到這個廣告卻沒有談論過汗蒸的人什麼也不會說。這也算是一種由倖存者偏差造成的現象了。

這種巧合就遠不如它們看起來那麼令人驚訝了。我們來舉個例子,如果有八支隊伍一起競爭冠軍,在一個賽季裏有4+2+1共七場淘汰賽,每場比賽只會產生兩個結果(不存在平局),那麼總共也只有2^7 = 128種可能而已。

 

假設一棟大樓裏有128戶人,我們把128種預測結果分給每一戶人家,那麼總有一家人會收到百分百準確的預測結果。他可能會震驚於結論的準確性,但實際上,只不過是我們的樣本數量夠大罷了。

 

錯誤實驗示範

 

有一位視頻博主在網上直播了他的實驗過程。他不過纔剛開口談論狗玩具,就向觀衆展示了隨之變化的谷歌推送廣告。但這與我們之前做的實驗僅僅只是看着相似而已,實際上完全不同。

最重要的差別在於,這個視頻博主從一開始就打開了麥克風,音頻數據直接傳到谷歌服務器上。顯然谷歌不會放過這些信息,於是作出了相應的推薦,只不過這個反應速度實在是太快太驚人了。

而我們的實驗實際上是在探索另一個完全不同的基本問題:麥克風到底有沒有在我們眼皮底下偷偷啓用?它是不是一直在聽我們的對話並將數據上傳服務器?

 

另外需要提醒讀者的一點是,真的會有人去聽互聯網巨頭們從我們身上通過合法方式獲取的音頻數據!即便他們是出於優化語音識別的目的,但萬一我們不小心提到了自己的名字、地址或是醫療記錄呢?這就和文本搜索陷入了類似的尷尬境地:你無條件地分享你想知道的一切。

 

最終結論

 

讓我們回到我們的實驗結果。儘管我和同事們連續一週都在討論水流控制系統,我們的手機上卻盡是些亂七八糟的廣告,和它沒多大關係。

我們提倡大家加入到實驗中來,更多實驗數據才能得出有代表性的普遍結論。留言告訴我們你可能會想要買的那些稀奇古怪的玩意兒,但記得不要直接寫出名稱,嘗試用諧音代替,別暴露了你的關鍵詞。

 

*原文轉載自「卡巴斯基實驗室」,青松編輯。

 

—  END —

安全之道,青松知道

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章