隨機遊走算法

隨機遊走(Random Walk,縮寫爲 RW),又稱隨機遊動或隨機漫步,是一種數學統計模型,它是一連串的軌跡所組成,其中每一次都是隨機的。它能用來表示不規則的變動形式,如同一個人酒後亂步,所形成的隨機過程記錄。因此,它是記錄隨機活動的基本統計模型

Random  Walk 是隨機過程(Stochastic  Process)的一個重要組成部分,通常描述的是最簡單的一維 Random  Walk 過程。下面給出一個例子來說明:考慮在數軸原點處有一隻螞蟻,它從當前位置(記爲x(t) )出發,在下一個時刻( x(t+1))以 的概率向前走一步(即 x(t+1)= x(t)+1),或者以 的概率向後走一步(即 x(t+1)= x(t)-1),這樣螞蟻每個時刻到達的點序列 就構成一個一維隨機遊走過程。

  本質上 Random  Walk 是一種隨機化的方法,在實際上生活中,例如醉漢行走的軌跡、花粉的布朗運動、證券的漲跌等都與 Random  Walk 有密不可分的關係。Random Walk已經被成功地應用到數學,物理,化學,經濟等各種領域。當前研究者們已經開始將 Random  Walk 應用到信息檢索圖像分割等領域,並且取得了一定的成果,其中一個突出的例子就是 Brin 和 Page 利用基於 Random Walk 的 PageRank 技術創建了 Google 公司。

隨機遊走的形式有:

  1. 馬爾可夫鏈馬可夫過程:一維隨機遊走也可以看作馬爾可夫鏈,其狀態空間由整數給出。
  2. 布朗運動
  3. 醉漢走路(drunkard’s walk)
  4. 萊維飛行(Lévy flight)

隨機遊走(random walk)矩陣可以看做是馬爾科夫鏈的一種特例。

喝醉的酒鬼總能找到回家的路,喝醉的小鳥則可能永遠也回不了家。

一維、二維隨機遊走過程中,只要時間足夠長,我們最終總能回到出發點;

三維網格中隨機遊走,最終能回到出發點的概率只有大約 34%;

四維網格中隨機遊走,最終能回到出發點的概率是 19.3% ;

八維空間中,最終能回到出發點的概率只有 7.3% ;

定理是著名數學家波利亞(George Pólya)在 1921 年證明的。

物理意義

隨機遊走是現實生活中常見的一種模型:

氣體分子的運動、滴入水中的墨水 、氣味的擴散、醉漢行走軌跡、花粉的布朗運動、證券的漲跌、拋硬幣…

  1. 物理學化學:Random Walk是擴散過程的基礎模型。
  2. 統計領域:馬爾可夫鏈蒙特卡羅(MCMC),解決近似計算問題。MCMC是解決近似計算問題一種重要方法,它能以比確定性算法快指數級的速度提供解決問題的最好隨機方法,目前已經被廣泛地應用在統計領域。 
  3. 信息檢索:早期搜索引擎如Yahoo使用的是關鍵字匹配技術,性能容易受到關鍵詞頻率的欺騙,所以搜索效果不是很好。1998年Jon Kleinberg 提出了HITS算法,Sergey Brin 和 Larry Page 提出了 PageRank算法之後,搜索的正確率就得到了巨大的改觀,這兩種技術都是基於Random Walk。《通用化的PageRank公式推導
  4. 經濟學:證券的漲跌
     

維基百科

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章