常见临近点算子的求解

本文将利用线性代数的知识推导出常见临近点算子的解,具体包括:

  • 投影算子
  • 一范数
  • 二次多项式
  • 核范数

临近点算子的标准形式

proxλf(v)=argminx(f(x)+(1/2λ)xv22)=argminxJ(x)prox_{\lambda f}(v)=\arg\min_x\left(f(x)+(1/2\lambda)\|x-v\|_2^2\right)=\arg\min_xJ(x)

投影算子

f=ICf=I_C为凸集CC上的示性函数,则:
proxλIC(v)=ΠC(v)=argminxCxv2prox_{\lambda I_C}(v)=\Pi_C(v)=\arg\min_{x\in C}\|x-v\|_2
即解为凸集CC上与点vv距离最小的点(投影点)。
示性函数的定义为
IC(x)={0,xC+,xCI_C(x)=\left\{ \begin{aligned} 0 &, x\in C\\ +\infty&, x\notin C \end{aligned}\right.
由示性函数的定义可知,xx必然在CC的内部,示性函数的临近点算子是显然的。

二次函数

f(x)=(1/2)xTPx+qTx+rf(x)=(1/2)x^TPx+q^Tx+r
proxλf(v)=(I+λP)1(vλq)prox_{\lambda f}(v)=(I+\lambda P)^{-1}(v-\lambda q)
二次函数是可微的,因此可以先求偏导数,然后利用最优化条件将偏导数置零。
xJ(x)=Px+q+1/λ(xv)=0\nabla_x J(x)=Px+q+1/\lambda (x-v)=0
整理后得到:
(I+λP)x=vλq(I+\lambda P)x=v-\lambda q
两边求逆即可。

一范数

f=1f=\|\cdot\|_1
proxλf(v)=(vλ)+(vλ)+={viλ,viλ0,viλvi+λ,viλprox_{\lambda f}(v)=(v-\lambda)_+-(-v-\lambda)_+= \left\{ \begin{aligned} v_i-\lambda &,v_i\ge\lambda \\ 0&, |v_i|\le\lambda \\ v_i+\lambda &,v_i\le-\lambda \end{aligned}\right.
由于一范数具有可分性,因此可以将原始的向量优化问题转换为标量优化问题,直接将xx表示标量xix_ivv表示viv_i,得到:
J(x)=x+(1/2λ)(xv)2J(x)=|x|+(1/2\lambda)(x-v)^2
此时可以通过讨论x0,x<0x\ge0, x<0来化为简单的二次函数优化问题。

核范数

核范数在矩阵XX上定义,为所有奇异值绝对值的和,即奇异值组成的向量的一范数。
X=iλi\|X\|_*=\sum_i |\lambda_i|
关于核范数的临近点算子的优化目标为:
J(X)=X+(1/2λ)XVF2J(X)=\|X\|_*+(1/2\lambda)\|X-V\|_F^2
解为:
proxλ=Vdiag(proxλf(σs(A)))Uprox_{\lambda \|\cdot\|_*}=Vdiag(prox_{\lambda f}(\sigma_s(A)))U
其中UσsVU\sigma_sVAA的SVD分解。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章