【算法2】Logistic回归

    关于Logistic回归,在《【R】基于Logistic回归的初始信用评级》做过粗略的介绍,看此文时可结合该文章,帮助理解。这里借鉴李航老师的《统计学习方法》 再补充一下。

1 logistic分布

    在统计学中,研究任何对象,都应该先摸透该对象的数据服从什么样的分布。在个人看来,数据的不同分布使得数据具有不同的性质,也就需要采用不同的技术进行研究。那么,logistic回归也不例外。
    设 L是连续随机变量,L服从逻辑斯谛分布是指L 具有下列分布函数和密函数:
F(l)=P(L<=l)=1(1+e(lu)/r) F(l)=P(L <=l)=\frac{1}{(1+e^{-(l-u)/r})}
f(l)=F(l)=P(L<=l)=e(lu)/rr(1+e(lu)/r)2 f(l)=F^\prime(l)=P(L <=l)=\frac{e^{-(l-u)/r}}{r(1+e^{-(l-u)/r})^2}
公式中,uu为位置参数,r>0r > 0为形状参数。
    logisticlogistic分布的密度函数f(l)f(l) 和 分布 函数 F(l)F(l)的 图形下图。分布函数是一个logisticlogistic函数,图形是 一条S形曲(sigmoidcurve)( sigmoid curve),点(u,12)(u,\frac{1}{2})为中心对称。
在这里插入图片描述
    曲线值阈为(01)(0,1),在点(u,12)(u,\frac{1}{2})附近变化快,离中心点越远,变化趋于平缓。

2 binomial logistic 回归

    binomiallogisticbinomial logistic 回归模型是一类二分类模型,由条件概率分布P(YL)P(Y|L)表示,形式为参数化的逻辑斯谛分布。这里,随机变量LL取值为实数,随机 变量YY取值为 1 或 0。通过监督学习的方法来估计模型参数。二项逻辑斯回归模型 是如下的件率布:

P(Y=1l)=exp(wl+b)1+exp(wl+b) P(Y=1|l)=\frac{exp^{(wl+b)}}{1+exp^{(wl+b)}}
P(Y=0l)=11+exp(wl+b) P(Y=0|l)=\frac{1}{1+exp^{(wl+b)}}
这里,lRnl ∊ R^n 是 输入,Y[0,1]Y ∊{ [0, 1]} 是 输出,wRnw ∊ R^nbRb ∊ R是 参数,ww 称为 权值 向量,bb 称为 偏 置,wlw· lwwll 的内积。
    探索logisticlogistic回归模型的特点。一个事件的机率odds( odds) 是指该事件发生的概率与该事件不发生的概率的比值。如果事件发生的概率是 p 那么该事件的机率是,该事件的对数机率logodds( log odds)logitlogit 函数是
logit(p)=logp1p logit(p)=log\frac{p}{1-p}
logisticlogistic而言,由二项逻辑斯回归模型
logit(p)=logp(Y=1l)1p(Y=1l)=wl. logit(p)=log\frac{p(Y=1|l)}{1-p(Y=1|l)}=wl.
也可以这样来解读,在binomiallogisticbinomial logistic 回归模型中输出Y=1Y=1的对数机率是输入ll的线性函数。将wlwl 转化为概率则有:
P(Y=1l)=exp(wl)1exp(wl). P(Y=1|l)=\frac{exp^{(wl)}}{1-exp^{(wl)}}.
这就是binomiallogisticbinomial logistic 回归模型。

3 参数的估计

    logisticlogistic回归模型学习时,存在的训练数据集 D(l1y1),(l2y2),,(lN,yN)D ={( l1, y1),( l2, y2),…,( l_N, y_N)}, 其中, liRnl_i ∊ R^nyi[0,1]y_i ∊[ 0, 1],可以应用极大似 然估计法估计模型参数ww,从而得到logisticlogistic回归模型。设:
P(Y=1l)=Ψ(l),P(Y=0l)=1Ψ(l) P(Y=1|l)=\varPsi(l) ,P(Y=0|l)=1-\varPsi(l)
得似然函数:
i=1N[Ψ(li)]yi[1Ψ(li)]1yi \prod_{i=1}^N [\varPsi(l_i)]^{y_i}[1-\varPsi(l_i)]^{1-y_i}

得对数似然函数:
LG(w)=k=1N[yilogΨ(li)+(1yi)log(1Ψ(li))] LG(w)=\sum_{k=1}^N [y_ilog\varPsi(l_i)+(1-y_i)log(1-\varPsi(l_i))]
=k=1N[yilogΨ(li)1Ψ(li)+log(1Ψ(li))] =\sum_{k=1}^N [y_ilog\frac{\varPsi(l_i)}{1-\varPsi(l_i)}+log(1-\varPsi(l_i))]
=k=1N[yi(wli)log(1+(wli))] =\sum_{k=1}^N [y_i(w*l_i)-log(1+(w*l_i))]
求解LG(w)LG(w)的极大值,得到ww的估计值w^\widehat{w}。这样合理的将问题转化为了以对数似然函数作为目标函数最优问题。logisticlogistic回归学习 中通常采用的方法是 梯度下降法、拟牛顿法。

4 multiterm logistic回归

    对于多项逻辑回归multitermlogisticmultiterm logistic),说的是当Y的输出不在只是二分类[0,1][0,1],而是形如[a,b,c,......,f,g,......][a,b,c,......,f,g,......]的多分类离散型。现在在这里不过多阐述,后期有时间会补上。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章