Backpropagation Algorithm 的梯度

損失函數 J(θ)

J(θ)=1mi=1mk=1K[yk(i)ln(hθ(X(i))k)+(1yk(i))ln(1hθ(X(i))k)]
              +λ2ml=1L1i=1sl+1j=1sl(θi,j(l))2

λ=0 時的單樣本損失函數 cost(θ;X,Y)

λ=0 時,單一樣本 X=(x1xs1),Y=(y1yK) 的損失函數:
cost(θ;X,Y)=k=1K[ykln(hθ(X)k)+(1yk)ln(1hθ(X)k)]

a(1)=X
Z(l+1)=θ(l)a(l),1lL1
a(l)=g(Z(l)),2lL, 其中函數 g 是 Logistic 函數。
a(L)=hθ(X)
於是 cost(θ;X,Y)=k=1K[yklnak(L)+(1yk)ln(1ak(L))]
J(θ)=1mi=1mcost(θ;X(i),Y(i))+λ2ml=1L1i=1sl+1j=1sl(θi,j(l))2

cost(θ;X,Y) 關於 Z(l) 的梯度

δ(l)=Z(l)cost(θ;X,Y)=(z1(l)cost(θ;X,Y)zsl(l)cost(θ;X,Y)),2lL,
δ(l)={a(L)Y,l=L,(θ(l))δ(l+1) . a(l) . (1a(l)),2lL1,
其中運算符  .  爲 element-wise 的乘積,如 (x1xn) . (y1yn)=(x1y1xnyn)

證明

命題等價於:
δj(l)={aj(L)yj,l=L,[i=1sl+1θi,j(l)δi(l+1)]δj(l)(1aj(l)),2lL1,1jsl

{Z(l+1)=θ(l)a(l),1lL1,a(l)=g(Z(l)),2lL, 得:
{zi(l+1)aj(l)=θi,j(l),1lL1,daj(l)dzj(l)=g(zj(l))=aj(l)(1aj(l)),2lL,
因此 zi(l+1)zj(l)=θi,j(l)aj(l)(1aj(l)),2lL1,
所以 δj(l)=i=1sl+1δi(l+1)zi(l+1)zj(l)
               =i=1sl+1δi(l+1)θi,j(l)aj(l)(1aj(l))
               =[i=1sl+1θi,j(l)δi(l+1)]δj(l)(1aj(l)),2lL1,

由於 ak(L)cost(θ;X,Y)=[yk1ak(L)(1yk)11ak(L)]
                                            =(ykak(L))1ak(L)(1ak(L))
                                            =(ak(L)yk)1ak(L)(1ak(L)),1ksL=K
因此 (δ(L))j=aL,jcost(θ;X,Y)daj(L)dzL,j
                      =(aj(L)yj)1aj(L)(1aj(L))aj(L)(1aj(L))
                      =aj(L)yj,1jsL
因此,命題成立。

cost(θ;X,Y) 關於 θ 的梯度

θi,j(l)cost(θ;X,Y)=δi(l+1)aj(l),1l<L1

證明

zi(l+1)θi,j(l)=aj(l),1lL1,
θi,j(l)cost(θ;X,Y)=δi(l+1)zi(l+1)θi,j(l)=δi(l+1)aj(l),1l<L1

推論

θ(l)cost(θ;X,Y)=δ(l+1)(a(l)),1l<L1

損失函數 J(θ) 關於 θ 的梯度

tN,1tm,
a(t,1)=X(t),
Z(t,l+1)=θ(l)a(t,l),1lL1,
a(t,l)=g(Z(t,l)),2lL,
a(t,L)=hθ(X(t))
δ(t,l)=Z(t,l)cost(θ;X(t),Y(t))=(z1(t,l)cost(θ;X(t),Y(t))zsl(t,l)cost(θ;X(t),Y(t))),2lL,
δ(t,l)={a(t,L)Y(t),l=L,(θ(l))δ(t,l+1) . a(t,l) . (1a(t,l)),2lL1,
於是 θi,j(l)cost(θ;X(t),Y(t))=δi(t,l+1)aj(t,l),1l<L1
因此  θi,j(l)J(θ)=1mt=1mθi,j(l)cost(θ;X(t),Y(t))+λmθi,j(l)
                           =1mi=1mδi(t,l+1)aj(t,l)+λmθi,j(l),1lL1

推論

 θ(l)J(θ)=1mi=1mδ(t,l+1)(a(t,l))+λmθ(l),1lL1

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章