机器学习笔记(4)·Logistic回归

产生式分类器和判别式分类器

产生式分类器:对联合分布p(x,y)建模
– 产生:能从联合分布p(x,y)中产生数据
– (朴素)贝叶斯分类器
– LDA/QDA
判别式分类器:直接对p(y|x)建模
– Logistic回归
– 感知机/神经元网络
– SVM

logistic回归

    logistic回归是对线性回归的扩展,它在线性回归的结果上再利用sigmod函数进行了一次映射。用函数表示成`@N@8`29V7ON{Q]%R7B{WLC.jpg

其中WT *X是前面提到的线性回归的表达式,sigm是sigmod函数,形式为F[$EK48$N7{G3XCQ]DIW33B.jpg。sigmod函数是一个S形函数,它将线性回归的结结果映射到(0,1)区间。

    这里我们只讨论类别是二值的分类。所以目标变量y服从伯努利分布。综合起来为VV{EO3A1@WR}GRI}G5TO)RH.jpg

OH}A)V`{G~5A{SJPX5]TYUU.jpg

MLE

    前面提到,目标变量y服从伯努利分布,并且给出了分布函数,下面就是通过MLE估计一个最优的W,使得该数据出现的概率最大。如果从统计决策理论看,我们可以将MLE看作是采用负log似然损失(negative log likelihood, NLL),使损失最小。

UUS4AD]2ADL{UJ4B~7LZ]W8.jpg

梯度下降

    我们要是的J(w)最小,采用和前面提到的线性回归相同的算法,只是梯度公式变化。


留言: