拉格朗日對偶問題與支持向量機學習筆記(1)
0?前言
這兩部分內(nèi)容在之前學凸優(yōu)化和數(shù)據(jù)挖掘課的時候就學過了,奈何當時課上全在摸魚,導致現(xiàn)在要用的時候啥也不會。于是在各種論壇上看別人的筆記,奈何自己實在過于愚笨,很多地方花了很多時間才理解。為了加深自己的印象以及練習一下剛學的markdown,還是寫個專欄記錄一下自己的學習成果。(不過我不得不說b站專欄對markdown的支持真的太差了,即使使用了相關插件,很多公式也無法識別;此外,由于b站專欄最多只能插入包括公式在內(nèi)的100張圖片,我不得不把這篇文章拆成兩部分才能發(fā)出來,真是呃呃了)。
本文參考了“https://blog.csdn.net/weixin_44378835/article/details/110732412?utm_source%20=%20app”這篇博文和其他一些博文,進行了一定的縮減,在部分地方添加了自己的想法和更詳細的推導過程。
1?拉格朗日對偶問題
1.1?原問題
給出如下的優(yōu)化問題:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
其中和
均為
的線性組合。我們稱這個問題為“原問題”。
在求解原問題的時候,我們會遇到兩個不喜歡的東西:①帶有約束條件②優(yōu)化目標不一定是凸函數(shù)。因此,我們希望通過轉化的方式將原問題變成一個沒有約束條件的凸問題,這也是引入拉格朗日乘子法以及構造拉格朗日對偶問題的原因。
1.2?消除約束條件
通過引入拉格朗日乘子,我們構造另一個函數(shù):
,其中
。顯然,當
滿足原問題的約束時,函數(shù)
。因此,我們找到了一個恒小于等于原優(yōu)化目標的函數(shù),繼續(xù)考慮使用此函數(shù)去逼近原優(yōu)化目標。
要用一個較小的函數(shù)逼近較大的函數(shù),顯然應當去極大化它。記。當
滿足原問題的約束時,我們?nèi)?img type="latex" class="latex" src="http://api.bilibili.com/x/web-frontend/mathjax/tex?formula=%5Clambda_i%20%3D%200" alt="%5Clambda_i%20%3D%200">,則此時
;當
不滿足原問題的約束時,我們不妨假設存在某個
,使得
,令
,則此時
。因此,
可以寫為如下形式:
? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
顯然,和
考慮構造另一個函數(shù)??梢宰C明,
是關于
的凹函數(shù)。
實際上,對于任何形如
的函數(shù),若
關于
的階次為1(給定
,
為關于
的線性函數(shù)),則函數(shù)
是關于
的凹函數(shù)。
相對應的,對于任何形如
的函數(shù),若
關于
的階次為1,則函數(shù)
是關于
的凸函數(shù)。
從直觀上去理解,假設
,對于每個
,都有一個關于
的線性函數(shù)
。對于每一個給定的
,令
,得到的就是所求的
。不難發(fā)現(xiàn),
是關于
的凹的分段線性函數(shù)。

構造優(yōu)化問題,我們稱它為原問題的對偶問題。顯然,這是一個無約束的、最大化凹函數(shù)的問題,它等價于最小化一個無約束的凸函數(shù)。
至此,我們從原問題出發(fā),構造了一個無約束的最小化凸函數(shù)問題。
1.4?原問題和對偶問題的關系
結論:對偶問題的最優(yōu)解≤原問題的最優(yōu)解,
證明過程利用了如下結論:
對于任意函數(shù)
,均有
直觀理解:“所有最大值里面的最小值”要大于“所有最小值里面的最大值”。
證明:;
記
;
記
;
則有
上述結論就是“弱對偶性”——對于任何上述形式的問題,對偶問題的最優(yōu)解小于等于原問題的最優(yōu)解。
1.5?KKT條件
$$
對于一般性優(yōu)化問題(為一般函數(shù)):
KKT是原問題轉化為對偶優(yōu)化問題的必要條件;
原問題準則函數(shù)和對偶準則函數(shù)的極值點通常不一致。
對于凸優(yōu)化問題(為凸函數(shù)):
滿足KKT條件的點,那么它們分別是 原問題準則函數(shù) 和 對偶準則函數(shù)的極值點并且 strong duality成立(
)
2?支持向量機(SVM)
這部分內(nèi)容會發(fā)在拉格朗日對偶問題與支持向量機學習筆記(2)中