隨機遊走(Random Walk,縮寫爲 RW),又稱隨機遊動或隨機漫步,是一種數學統計模型,它是一連串的軌跡所組成,其中每一次都是隨機的。它能用來表示不規則的變動形式,如同一個人酒後亂步,所形成的隨機過程記錄。因此,它是記錄隨機活動的基本統計模型。
Random Walk 是隨機過程(Stochastic Process)的一個重要組成部分,通常描述的是最簡單的一維 Random Walk 過程。下面給出一個例子來說明:考慮在數軸原點處有一隻螞蟻,它從當前位置(記爲x(t) )出發,在下一個時刻( x(t+1))以 的概率向前走一步(即 x(t+1)= x(t)+1),或者以 的概率向後走一步(即 x(t+1)= x(t)-1),這樣螞蟻每個時刻到達的點序列 就構成一個一維隨機遊走過程。
本質上 Random Walk 是一種隨機化的方法,在實際上生活中,例如醉漢行走的軌跡、花粉的布朗運動、證券的漲跌等都與 Random Walk 有密不可分的關係。Random Walk已經被成功地應用到數學,物理,化學,經濟等各種領域。當前研究者們已經開始將 Random Walk 應用到信息檢索、圖像分割等領域,並且取得了一定的成果,其中一個突出的例子就是 Brin 和 Page 利用基於 Random Walk 的 PageRank 技術創建了 Google 公司。
隨機遊走的形式有:
隨機遊走(random walk)矩陣可以看做是馬爾科夫鏈的一種特例。
喝醉的酒鬼總能找到回家的路,喝醉的小鳥則可能永遠也回不了家。
一維、二維隨機遊走過程中,只要時間足夠長,我們最終總能回到出發點;
三維網格中隨機遊走,最終能回到出發點的概率只有大約 34%;
四維網格中隨機遊走,最終能回到出發點的概率是 19.3% ;
八維空間中,最終能回到出發點的概率只有 7.3% ;
定理是著名數學家波利亞(George Pólya)在 1921 年證明的。
物理意義
隨機遊走是現實生活中常見的一種模型:
氣體分子的運動、滴入水中的墨水 、氣味的擴散、醉漢行走軌跡、花粉的布朗運動、證券的漲跌、拋硬幣…
- 物理學化學:Random Walk是擴散過程的基礎模型。
- 統計領域:馬爾可夫鏈蒙特卡羅(MCMC),解決近似計算問題。MCMC是解決近似計算問題一種重要方法,它能以比確定性算法快指數級的速度提供解決問題的最好隨機方法,目前已經被廣泛地應用在統計領域。
- 信息檢索:早期搜索引擎如Yahoo使用的是關鍵字匹配技術,性能容易受到關鍵詞頻率的欺騙,所以搜索效果不是很好。1998年Jon Kleinberg 提出了HITS算法,Sergey Brin 和 Larry Page 提出了 PageRank算法之後,搜索的正確率就得到了巨大的改觀,這兩種技術都是基於Random Walk。《通用化的PageRank公式推導》
- 經濟學:證券的漲跌