7分钟掌握逻辑回归核心原理
7分钟搞懂逻辑回归的来龙去脉
逻辑回归是一种统计机器学习技术,简单易用,但需要大量知识。俗话说,麻雀虽小,五脏俱全。
大多数教程都从解释逻辑回归的定义和原理开始,这很容易显得不清楚。
本文将结合例子和图解,帮助读者在7分钟内理解逻辑回归算法。
1. 函数逻辑回归常用于二分类问题,可以提供两类对应的概率。
常见的应用包括垃圾邮件检测、银行决定是否向用户发放贷款等。
当然,二分类问题可以扩展到多分类问题。
对于二分类问题,最简单的判别函数是阶跃函数,如下图红线所示。
此时评定为正类(1),否则评定为负类(0)。
然而,阶跃函数是不连续的,过于“僵化”,不利于后续的推理和优化。
所以改用logistic函数(上图中的黑线)。
由于它的形状像一个S,所以也被称为sigmoid函数。
相应的公式是:定义域是整个实数集。
取值范围是0到1,相当于概率值。
2、为什么不叫逻辑分类? 既然这是一个分类问题,为什么不称之为“逻辑分类”呢? 首先,“逻辑”指的是“物流”(音译),“回归”来自于线性回归。
使用线性回归来拟合和近似决策边界,使得根据该边界对数据进行分类后的总损失为。
保持在最低限度。
以概率0.5为界,将数据分为正例和负例。
当[公式]匹配正例时(接近概率1); 什么时候【公式】对应反例(逼近概率为0); 它是利用回归的思想来解决分类问题,这也是为什么称为逻辑回归。
这相当于在线性回归外面包裹了一个sigmoid函数层,将离散值映射到0到1之间的概率,限制为0.5。
3.基本问题理解逻辑回归的主要问题是如何求解决策边界【公式】对于二维输入样本点,z相当于:求最优决策边界,相当于求【公式】的值]。
当样本的真实标签[公式]为1和0时,我们相应地定义损失函数:以[公式]为例,当模型的预测值[公式]趋于1时,损失函数的值也应该变得越来越小; 相反,当[公式]接近0时,损失函数的值变得越来越大,这一点可以通过函数[公式]反映出来。
训练模型的目标是尽可能减少损失,因此输出值将在方向1上学习。
是否可以将两种类型的成本函数合二为一,以便更容易计算总损失? 使用智能对数似然函数,我们实现了我们的目标: 其中: [公式] 对于下图中的样本点,绿线是决策边界。
绿线上方【公式】,距离绿线越远,【公式】越大,【公式】的预测值越接近1。
这证明你也热爱学习。
希望您在继续阅读之前花 1 秒钟喜欢并标记本文。
谢谢你! 4.边界解。
确定损失函数后,我们计算模型参数的最优值。
首先需要计算成本相对于参数【公式】的导数,然后利用梯度下降等算法微调参数的值,不断逼近最优解。
假设我们有10个样本点,每个样本包含3个特征,那么【公式】的维度为[10,3],【公式】的维度为[3,1],并且[formula] 和 [formula] 的维度为 [10,1]。
【公式】损失函数: 【公式】成本维度也是[10,1]。
成本与H相关,H与Z相关,Z与WX相关。
存在一个映射关系:cost~H~Z~X。
根据链式推理规则,整个计算过程是这样的: 最终结果:【公式】,维度【3,1】,即参数【公式】。
5.梯度下降法我们刚刚使用了梯度下降法来迭代寻找最优选项,分为3个阶段:当成本函数是凸函数时,可以保证成本会下降到全局最小值,否则只能达到局部最小值。
随着成本的不断降低,就会得到最优的分割线。
对于逻辑回归,我们可以使用Python、C++等语言自己实现,也可以使用Sklearn机器学习工具包中的LogisticRegrade[2]接口。
现在你明白逻辑回归的思想了吗? 如果您有任何疑问,请随时聊天!
逻辑回归算法原理是什么?
逻辑回归算法原理 1.明确答案 逻辑回归是一种用于解决二元分类问题的统计学习方法。它通过拟合逻辑函数来预测实例属于特定类别的概率来执行分类。
逻辑回归的本质是逻辑函数,它将线性回归模型的输出值映射到0到1的区间,以表达属于某一类别的概率。
二、详细说明 1、逻辑回归的目标和基本原理 逻辑回归主要用于处理因变量为二分类的情况。
它通过拟合逻辑函数模型来预测样本点属于给定类别的概率。
逻辑回归输出值是0到1之间的概率值。
sigmoid函数通常用作逻辑回归模型的激活函数,将模型输出映射到这个区间。
2.模型创建和训练过程在逻辑回归中,模型创建是通过最小化损失函数来实现的。
损失函数衡量模型的预测值与真实值之间的差异,通过优化算法不断调整模型参数以最小化损失函数。
常见的损失函数有熵间损失函数等。
在训练过程中,模型学习输入特征与输出类别之间的非线性或线性关系,以获得最优模型参数。
3.预测和决策经过训练的逻辑回归模型可以用来预测新数据点的类别。
在预测过程中,样本的新特征被输入到模型中,模型将推导出样本属于某个类别的概率。
最终的分类决策可以根据既定阈值或实际需要做出。
3.总结Logistic回归是一种基于统计学习的分类方法,通过拟合Logistic函数来预测样本点属于给定类别的概率。
其原理包括模型创建、训练、预测、决策等步骤,其中损失函数的优化和模型参数的学习是关键。
由于其简单有效的特点,逻辑回归在实际应用中得到了广泛的应用。