meanshift算法

原創

2020-02-21 04:52

轉自http://blog.csdn.net/lu597203933/article/details/17042331
可參考http://blog.csdn.net/carson2005/article/details/7337432
http://wenku.baidu.com/view/995c9c1fff00bed5b9f31d88.html?re=view
https://en.wikipedia.org/wiki/Mean_shift
http://blog.csdn.net/ttransposition/article/details/38514127

原理說明：

　　meanShift,均值漂移，在聚類、圖像平滑、分割、跟蹤等方面有着廣泛的應用。meanShift這個概念最早是由Fukunage在1975年提出的，其最初的含義正如其名：偏移的均值向量；但隨着理論的發展，meanShift的含義已經發生了很多變化。如今，我們說的meanShift算法，一般是指一個迭代的步驟，即先算出當前點的偏移均值，然後以此爲新的起始點，繼續移動，直到滿足一定的結束條件。
　　在很長一段時間內，meanShift算法都沒有得到足夠的重視，直到1995年另一篇重要論文的發表。該論文的作者Yizong Cheng定義了一族核函數，使得隨着樣本與被偏移點的距離不同，其偏移量對均值偏移向量的貢獻也不同。其次，他還設定了一個權重係數，使得不同樣本點的重要性不一樣，這大大擴展了meanShift的應用範圍。此外，還有研究人員將非剛體的跟蹤問題近似爲一個meanShift的最優化問題，使得跟蹤可以實時進行。目前，利用meanShift進行跟蹤已經相當成熟。
　　給定d維空間Rd的n個樣本點 ,i=1,…,n,在空間中任選一點x，那麼Mean Shift向量的基本形式定義爲:
　　　　　　　　　　　

Sk是一個半徑爲h的高維球區域,滿足以下關係的y點的集合,
　　　　　　　
k表示在這n個樣本點xi中,有k個點落入Sk區域中.

　　以上是官方的說法，即書上的定義，我的理解就是，在d維空間中，任選一個點，然後以這個點爲圓心，h爲半徑做一個高維球，因爲有d維，d可能大於2，所以是高維球。落在這個球內的所有點和圓心都會產生一個向量，向量是以圓心爲起點落在球內的點位終點。然後把這些向量都相加。相加的結果就是Meanshift向量。

　　在二維情況下更易於理解，如圖所示，其中黃色箭頭就是Mh（meanshift向量）。

　　再以meanshift向量的終點爲圓心，再做一個高維的球。如下圖所以，重複以上步驟，就可得到一個meanshift向量。如此重複下去，meanshift算法可以收斂到概率密度最大得地方。也就是最稠密的地方。

　　最終的結果如下：

Meanshift推導：

把基本的meanshift向量加入核函數，核函數的性質在這篇博客介紹：http://www.cnblogs.com/liqizhou/archive/2012/05/11/2495788.html
及http://blog.csdn.net/carson2005/article/details/7243425
那麼，meanshift算法變形爲
　　　　　　　　　　　　　　（１）

　　解釋一下K()核函數，h爲半徑，Ck,d/nhd 爲單位密度，要使得上式f得到最大，最容易想到的就是對上式進行求導，的確meanshift就是對上式進行求導.
（２）
令：
　　　　　　　　　　　　　　
K(x)叫做g(x)的影子核，名字聽上去聽深奧的，也就是求導的負方向，那麼上式可以表示：

對於上式，如果採用高斯核，那麼，第一項就等於fh,k
　　　　　　　　　
第二項就相當於一個meanshift向量的式子：
　　　　　　　　　
那麼（2）就可以表示爲
　　下圖分析的構成，如圖所以，可以很清晰的表達其構成。
　　　　　　　　　
　　要使得=0，當且僅當=0，可以得出新的圓心座標：
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　（3）

上面介紹了meanshift的流程，但是比較散，下面具體給出它的算法流程。

　　１.選擇空間中x爲圓心，以h爲半徑爲半徑，做一個高維球，落在所有球內的所有點xi
　　２.計算，如果<ε(人工設定)，退出程序。如果>ε, 則利用（3）計算x，返回1.

2.meanshift在圖像上的聚類：

　　真正大牛的人就能創造算法，例如像meanshift，em這個樣的算法，這樣的創新才能推動整個學科的發展。還有的人就是把算法運用的實際的運用中，推動整個工業進步，也就是技術的進步。下面介紹meashift算法怎樣運用到圖像上的聚類核跟蹤。

　　一般一個圖像就是個矩陣，像素點均勻的分佈在圖像上，就沒有點的稠密性。所以怎樣來定義點的概率密度，這纔是最關鍵的。

　　如果我們就算點x的概率密度，採用的方法如下：以x爲圓心，以h爲半徑。落在球內的點位xi 定義二個模式規則。

　　（1）x像素點的顏色與xi像素點顏色越相近，我們定義概率密度越高。

　　（2）離x的位置越近的像素點xi，定義概率密度越高。

　　所以定義總的概率密度，是二個規則概率密度乘積的結果，可以（4）表示

　　　　　　　　　　　　　　　　　　　（4）

　　其中：代表空間位置的信息，離遠點越近，其值就越大，表示顏色信息，顏色越相似，其值越大。如圖左上角圖片，按照（4）計算的概率密度如圖右上。利用meanshift對其聚類，可得到左下角的圖。
　　　　　　　　　　　　　

　　另附網上別人整理的文檔和用例，感覺挺詳細的Mean-Shift原理概述.pdf

發佈了9 篇原創文章 · 獲贊 15 · 訪問量 6萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

大模型在推薦系統中的精準推薦策略與實踐

引言推薦系統在現代互聯網應用中佔據了極其重要的位置。無論是電商平臺、社交媒體、音樂和視頻流媒體服務，還是新聞和內容推薦系統，推薦系統都在提高用戶體驗和平臺收益方面發揮着關鍵作用。近年來，隨着人工智能和機器學習技術的迅猛發展，大模型（如G

2024-06-06 23:55:10

解讀注意力機制原理，教你使用Python實現深度學習模型

本文分享自華爲雲社區《使用Python實現深度學習模型：注意力機制（Attention）》，作者：Echo_Wish。在深度學習的世界裏，注意力機制（Attention Mechanism）是一種強大的技術，被廣泛應用於自然語言處理（NL

2024-05-27 10:58:44

文心大模型免費辣，動手搓點啥慶祝一下吧

5月21日下午，百度智能雲宣佈文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費，即刻生效。這兩款大模型都是今年3月剛剛發佈的，均支持8K和128k上下文長度。可以說，這是百度最新的模型

2024-05-24 12:13:22

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

文心大模型“你說我畫”：PaddleHub與PaddleSpeech的協同實踐

在人工智能領域中，自然語言處理和計算機視覺是兩個非常活躍的研究方向。隨着深度學習技術的發展，這兩個領域之間的交叉融合產生了許多令人興奮的應用場景。其中，“你說我畫”就是這樣一個結合自然語言處理和計算機視覺技術的創新應用。 “你說我畫”的核心

2024-04-22 11:29:20

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

大模型應用與邊緣端推理：前沿技術與實現方案

一、大模型概述在人工智能領域，模型的大小和複雜度是衡量其性能的重要指標。大模型通常指的是參數數量龐大、結構複雜的深度學習模型，如GPT-3、BERT等。它們通過訓練大量的數據，能夠捕捉到更豐富的語義信息，從而在各種任務中表現出色。二、大

2024-03-29 11:59:34

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

FastGPT：大模型應用的新里程碑

隨着人工智能技術的不斷進步，大模型在衆多領域的應用已經成爲一種趨勢。FastGPT作爲一種先進的大模型，其強大的自然語言處理能力爲衆多領域帶來了革命性的變革。本文將帶您深入瞭解FastGPT在各個領域的應用，以及大模型應用所面臨的挑戰與前景

2024-03-18 12:35:42

多模態+大模型會帶來哪些“化學反應”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

OpenAI文生視頻大模型Sora：重塑視頻內容生產

在當今信息爆炸的時代，視頻已經成爲了最爲熱門的傳播媒介之一。然而，視頻內容的生產卻是一項極其耗費人力和物力的任務。爲了解決這一問題，美國人工智能公司OpenAI最近發佈了一款名爲Sora的文生視頻大模型，旨在通過AI技術自動化視頻內容的生產

2024-03-04 12:35:26

大模型如何助力開發者打造新質生產力

在當今的AI編程時代，大模型已經成爲了推動技術進步和產業變革的重要力量。大模型，即大型神經網絡，具有海量的參數和複雜的結構，能夠處理更廣泛、更復雜的任務。隨着數據集的擴大和計算能力的提升，大模型在語音識別、自然語言處理、計算機視覺等領域取得

2024-02-26 12:25:04

大模型時代：探索人工智能發展的新動向

在過去的幾年裏，人工智能（AI）已經從一種科幻概念轉變爲現實世界中的實用工具，深刻地改變了我們的生活方式。然而，儘管AI取得了顯著的進步，但它的潛力遠未被完全挖掘。如今，隨着大模型技術的飛速發展，AI正邁入一個新的發展階段，這爲企業和開發者

2024-02-22 12:33:52

文檔圖像大模型在智能文檔處理領域中的應用

隨着人工智能技術的不斷髮展，智能文檔處理已成爲一個備受關注的研究領域。智能文檔處理是指利用計算機技術自動從複雜的非結構化和半結構化文檔中抽取關鍵數據，並將其轉換成結構化數據的過程。在這個過程中，大模型技術發揮着越來越重要的作用。大模型在智

2024-02-19 12:29:56

12 點半！Voxel51 亞太地區計算機視覺線上 Meetup，速來！

7 月 20 日，VOXEL51 亞太地區計算機視覺 Meetup 將於北京時間 12 時 30 分在線上舉行，Zilliz 軟件工程師 Fillip Haltmayer 受邀參與主題分享環節。｜北京時間 20 日中午 12 時 30

2023-07-20 14:17:21

24小時熱門文章

最新文章

最新評論文章