十大機器學習算法之支持向量機（二）

原創

小小菜鸟一只

2020-06-21 00:43

3、拉格朗日對偶

先拋開上面的二次規劃問題，先來看看存在等式約束的極值問題求法，比如下面的最優化問題：

目標函數是f(w)，下面是等式約束。通常解法是引入拉格朗日算子，這裏使用β來表示算子，得到拉格朗日公式爲

L是等式約束的個數。
然後分別對w和β求偏導，使得偏導數等於0，然後解出w和β。至於爲什麼引入拉格朗日算子可以求出極值，原因是f(w)的dw變化方向受其他不等式的約束，dw的變化方向與f(w)的梯度垂直時才能獲得極值，而且在極值處，f(w)的梯度與其他等式梯度的線性組合平行，因此他們之間存在線性關係。（參考《最優化與KKT條件》）
然後我們探討有不等式約束的極值問題求法，問題如下：

我們定義一般化的拉格朗日公式

這裏的和都是拉格朗日算子。如果按這個公式求解，會出現問題，因爲我們求解的是最小值，而這裏的已經不是0了，我們可以將調整成很大的正值，來使最後的函數結果是負無窮。因此我們需要排除這種情況，我們定義下面的函數：

這裏的P代表primal。假設或者，那麼我們總是可以調整和來使得有最大值爲正無窮。而只有g和h滿足約束時，爲f(w)。這個函數的精妙之處在於，而且求極大值。
因此我們可以寫作

這樣我們原來要求的min f(w)可以轉換成求了。

我們使用來表示。如果直接求解，首先面對的是兩個參數，而也是不等式約束，然後再在w上求最小值。這個過程不容易做，那麼怎麼辦呢？
我們先考慮另外一個問題
D的意思是對偶，將問題轉化爲先求拉格朗日關於w的最小值，將α和β看作是固定值。之後在求最大值的話：

這個問題是原問題的對偶問題，相對於原問題只是更換了min和max的順序，而一般更換順序的結果是Max Min(X) <= MinMax(X)。然而在這裏兩者相等。用d*來表示對偶問題如下：

下面解釋在什麼條件下兩者會等價。假設f和g都是凸函數，h是仿射的（affine，there exists , ,so that ）。並且存在w使得對於所有的i，。在這種假設下，一定存在,,使得是原問題的解，,是對偶問題的解。還有另外，,,滿足庫恩-塔克條件（Karush-Kuhn-Tucker, KKT condition），該條件如下：

所以如果,,滿足了庫恩-塔克條件，那麼他們就是原問題和對偶問題的解。讓我們再次審視公式（5），這個條件稱作是KKT dual complementarity條件。這個條件隱含了如果>0,那麼。也就是說，時，w處於可行域的邊界上，這時纔是起作用的約束。而其他位於可行域內部（）點都是不起作用的約束，其=0。這個KKT雙重補足條件會用來解釋支持向量和SMO的收斂測試。
這部分內容思路比較凌亂，還需要先研究下《非線性規劃》中的約束極值問題，再回頭看看。KKT的總體思想是將極值會在可行域邊界上取得，也就是不等式爲0或等式約束裏取得，而最優下降方向一般是這些等式的線性組合，其中每個元素要麼是不等式爲0的約束，要麼是等式約束。對於在可行域邊界內的點，對最優解不起作用，因此前面的係數爲0。

4、最優間隔分類器（optimal margin classifier）

重新回到SVM的優化問題：

我們將約束條件改寫爲：

從KKT條件得知只有函數間隔是1（離超平面最近的點）的線性約束式前面的係數>0，也就是說這些約束式，對於其他的不在線上的點()，極值不會在他們所在的範圍內取得，因此前面的係數=0.注意每一個約束式實際就是一個訓練樣本。
看下面的圖：

實線是最大間隔超平面，假設×號的是正例，圓圈的是負例。在虛線上的點就是函數間隔是1的點，那麼他們前面的係數>0,其他點都是=0。這三個點稱作支持向量。構造拉格朗日函數如下：

注意到這裏只有沒有是因爲原問題中沒有等式約束，只有不等式約束。
下面我們按照對偶問題的求解步驟來一步步進行，

首先求解的最小值，對於固定的，的最小值只與w和b有關。對w和b分別求偏導數。

並得到

將上式帶回到拉格朗日函數中得到，此時得到的是該函數的最小值（目標函數是凸函數）
代入後，化簡過程如下：

最後得到

由於最後一項是0，因此簡化爲

這裏我們將向量內積表示爲
此時的拉格朗日函數只包含了變量。然而我們求出了才能得到w和b。
接着是極大化的過程，

前面提到過對偶問題和原問題滿足的幾個條件，首先由於目標函數和線性約束都是凸函數，而且這裏不存在等式約束h。存在w使得對於所有的i，。因此，一定存在,使得是原問題的解，是對偶問題的解。在這裏，求就是求了。
如果求出了，根據即可求出w（也是，原問題的解）。然後

即可求出b。即離超平面最近的正的函數間隔要等於離超平面最近的負的函數間隔。
關於上面的對偶問題如何求解，將留給下一篇中的SMO算法來闡明。
這裏考慮另外一個問題，由於前面求解中得到

我們通篇考慮問題的出發點是，根據求解得到的，我們代入前式得到

也就是說，以前新來的要分類的樣本首先根據w和b做一次線性運算，然後看求的結果是大於0還是小於0,來判斷正例還是負例。現在有了，我們不需要求出w，只需將新來的樣本和訓練數據中的所有樣本做內積和即可。那有人會說，與前面所有的樣本都做運算是不是太耗時了？其實不然，我們從KKT條件中得到，只有支持向量的=0，其他情況>0。因此，我們只需求新來的樣本和支持向量的內積，然後運算即可。這種寫法爲下面要提到的核函數（kernel）做了很好的鋪墊。後面還有幾篇關於SVM的，大家期待吧！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

軟件測試從自動化到智能化，大模型開始加入

隨着科技的飛速發展，軟件行業也在不斷地演進和創新。作爲軟件行業的關鍵環節之一，軟件測試行業也在經歷着前所未有的變革。從最初的手動測試，到自動化測試，再到如今的智能化測試，軟件測試行業正在經歷一場深刻的技術革命。在這場革命中，Testin雲測

2024-04-19 00:53:25

裁員了！別錯過2024年大數據工程師必備的10項技能

在當今快速發展的世界中，數據被視爲新的石油。隨着對數據驅動洞察的日益依賴，大數據工程師的角色比以往任何時候都更爲關鍵。這些專業人員在管理和優化組織內的數據操作中扮演着至關重要的角色。在本文中，我們將探索2024年大數據工程師必須具備的十

2024-04-16 11:00:53

DevOps已死？2024年的DevOps將如何發展

隨着我們進入2024年，DevOps也隨之發生變化。新興的技術、變化的需求和發展的方法正在重新定義有效實施DevOps實踐。 IDC預測顯示，未來五年，支持DevOps實踐的產品市場繼續保持健康且快速增長，2022年-2027年的複合年增長

2024-04-08 12:51:44

從模型到部署，教你如何用Python構建機器學習API服務

本文分享自華爲雲社區《Python構建機器學習API服務從模型到部署的完整指南》，作者：檸檬味擁抱。在當今數據驅動的世界中，機器學習模型在解決各種問題中扮演着重要角色。然而，將這些模型應用到實際問題中並與其他系統集成，往往需要構建API

2024-04-08 10:33:17

測試左移已經開始影響DevOps的發展？

在軟件開發的早期，該過程通常是開發人員編寫代碼，再將其交給質量保證（QA）進行測試。這種瀑布開發方法可能會導致質量問題和延遲，因爲問題是在週期後期發現的。一、瞭解DevOps和測試左移 DevOps是Development和Operati

2024-04-07 12:48:37

黑盒Prompt優化：提升大模型反饋效果的新思路

隨着人工智能技術的快速發展，大模型在各種應用場景中發揮着越來越重要的作用。然而，如何提升大模型的反饋效果，使其更加準確、高效地爲用戶提供服務，一直是研究者和開發者關注的焦點。本文提出了一種新的思路——黑盒Prompt優化，旨在通過改進輸入提

2024-03-29 00:01:17

分佈式數據庫技術的演進和發展方向

這些年大家都在談分佈式數據庫，各大企業也紛紛開始做數據庫的分佈式改造。那麼，所謂的分佈式數據庫到底是什麼？採用什麼架構？優勢在哪？爲什麼越來越多企業選擇它？分佈式數據庫技術會向什麼方向發展？帶着這些疑問，一探究竟吧！參與文末的話題互動

2024-03-26 11:34:43

利用RAG技術打破大模型幻覺

隨着人工智能技術的不斷進步，大模型在各個領域中發揮着越來越重要的作用。然而，大模型幻覺問題一直是制約其進一步發展的瓶頸。爲了解決這一問題，研究者們不斷探索新的技術和方法。近年來，一種名爲RAG（檢索增強生成）的技術備受關注，它通過結合知識圖

2024-03-21 00:28:34

與 NVIDIA 再次合作、深度參與 GTC，Zilliz 與全球頂尖開發者共迎 AI 變革時刻！

Zilliz 與全球的頂尖開發者齊聚 GTC 2024。近日，備受關注的 NVIDIA GTC 2024 已拉開序幕，來自世界各地的頂尖 AI 開發者齊聚美國加州聖何塞會議中心，共同探索行業未來。作爲去年被 NVIDIA CEO 黃仁

2024-03-19 21:26:53

多模態+大模型會帶來哪些“化學反應”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

婦女節：打開 AI 視界，成就“她力量”

根據國內招聘平臺獵聘發佈的《2024 女性人才數據洞察報告》，從 2023 年 3 月到 2024 年 2 月，女性在 AIGC 領域的求職人次同比增長了 190.49%。隨着人工智能時代的降臨，女性正以前所未有的姿態，在技術的助力下，蛻變

2024-03-09 01:06:57

AI安全白皮書 | “深度僞造”產業鏈調查以及四類防禦措施

以下內容，摘編自頂象防禦雲業務安全情報中心正在製作的《“深度僞造”視頻識別與防禦白皮書》，對“深度僞造”感興趣的網友，可前往頂象留言，在該白皮書完成後，會爲您免費寄送一份電子版。 “深度僞造”就是創建高度逼真的虛假視頻或虛假錄音，然

2024-03-08 00:45:22

24小時熱門文章

最新文章

最新評論文章