Sklearn 逻辑回归17 Mar 2025 | 6 分钟阅读 在本教程中,我们将学习逻辑回归模型,这是一种用作分类器的线性模型,用于对因变量进行分类。我们将使用 sklearn 的逻辑回归类在数据集上实现此模型。 什么是逻辑回归?预测分析和分类经常使用这种机器学习回归模型,也称为 logit 模型。根据给定的自变量数据集,逻辑回归模型计算事件发生的概率,例如是否投票。鉴于结果是事件发生的概率,因变量的范围是 0 到 1。 在逻辑回归模型中,使用 logit 公式转换胜率(事件成功的概率除以失败的概率)。以下公式用于表示这个逻辑函数,有时也称为 log odds 或 odds 的自然对数。 ![]() 在逻辑回归模型的方程中,Logit(pi) 是因变量或目标变量,而 x 是自变量。估算此线性模型系数的最常见方法是使用最大似然估计 (MLE)。此方法通过迭代评估系数的各种值来找到 log odds 的最佳拟合。 在这些迭代之后,创建对数似然函数,逻辑回归的目标是最大化此函数以获得最准确的参数估计。一旦确定了最佳系数(如果存在多个自变量,则为系数),就可以计算每个观测类别的条件概率,对其取对数并相加,以产生预测概率。 如果分类是二元的,则概率小于 0.5 预测为 0,概率大于 0 预测为 1。一旦计算出逻辑回归模型,就建议评估线性模型的拟合优度或它对因变量类别的预测能力。Hosmer-Lemeshow 检验是评估模型拟合的常用技术。 Sklearn 逻辑回归示例Sklearn 逻辑回归参数
Sklearn 逻辑回归分类器代码 输出 [0 0] [[9.81764058e-01 1.82359281e-02 1.43020498e-08] [9.71660947e-01 2.83390229e-02 2.99214023e-08]] 0.9733333333333334 逻辑回归 CV 示例代码 输出 [0 0] [[9.91624054e-01 8.37594552e-03 2.92559111e-11] [9.85295789e-01 1.47042107e-02 1.03510087e-10]] 0.9866666666666667 Scikit-learn 逻辑回归系数在本节中,我们将学习如何使用 sklearn 逻辑回归系数。 一个数,我们将自变量乘以该值,称为该特征的系数。在这里,特征的大小和方向由逻辑回归表示。 代码 输出 The size of the complete dataset is: 150 [[-0.35041623 0.91723236 -2.23583834 -0.97778255] [ 0.56061567 -0.44283218 -0.21739708 -0.64651405] [-0.21019944 -0.47440019 2.45323542 1.6242966 ]] Sklearn 逻辑回归特征重要性在本节中,我们将研究 sklearn 逻辑回归的特征重要性。 "特征重要性" 是一种方法,它为每个自变量分配一个权重,并根据该值得出信息在预测目标变量方面的价值。 代码 输出 [ 1.96365376 -0.11875128 -0.32930302 1.23664458 -1.40461804] Feature: 0, weight: 1.9636537611525497 Feature: 1, weight: -0.1187512810730595 Feature: 2, weight: -0.32930302369908127 Feature: 3, weight: 1.236644582783369 Feature: 4, weight: -1.4046180417231233 ![]() Sklearn 逻辑回归交叉验证代码 输出 Cross-validation accuracy scores of each split is: [0.80666667 0.80666667 0.81333333 0.86666667 0.78666667 0.8 0.78 0.82 0.80666667 0.83333333] mean and standard deviation of the scores is: 0.812 0.023247461032216934 |
legendre.legder 方法 Python Legendre 模块提供了几个函数,例如分类账,可用于对 Legendre 系列进行数学和微积分运算。它是 Legendre 类提供的功能之一。以下是分类账方法的列表...
阅读 3 分钟
Python 编程语言为所有类型的项目提供了不同类型的库。同样,Python 拥有各种数据可视化库,以便用户能够非常详细地理解数据集并正确分析它。每个可视化库都有其自身的特点。使用...
阅读 10 分钟
首先,我们应该了解 Python 电子邮件包是什么。电子邮件包是一个用于管理电子邮件消息的库。它明确不旨在执行任何电子邮件消息发送到 SMTP (RFC 2821)、NNTP 或其他服务器;这些任务由 smtplib 等模块执行...
阅读 6 分钟
如果一个数的平方的最后几位与这个数本身相同,那么这个数就被称为自守数。以下是自守数的例子:1. 输入:25 输出 - 是的,它是一个自守数。原因 - 25 的平方是 625,...
阅读 3 分钟
Python 等编程语言提供了多种开发图形用户界面(GUI)的选项。在这些用于 GUI 的方法中,Tkinter 是最广泛使用的库。在下面的教程中,我们将创建一个 GUI 应用程序来计算百分位数……
阅读 17 分钟
在本教程中,我们将学习如何在 Python 函数中创建全局变量。全局变量是一种可以在程序的任何部分(包括函数内部)访问的变量。为了确保代码的正常运行,...
11 分钟阅读
? cbind 函数是实现此目的最简单的方法之一。cbind 方法(column bind 的缩写)是一个融合函数,它将两个行数相同的不同数据帧组合成一个统一的数据帧。它比它稍微困难一点...
阅读 2 分钟
本教程将向您展示如何使用 Python 的 tkinter 制作一个简单的注册表单。在开始之前,我们需要对 tkinter 有一些了解。因此,我们将首先检查此 tkinter 模块,然后再制作一个基本注册表单。介绍 Tkinter:虽然还有其他...
阅读 6 分钟
机械技术是一个先进的工作领域,机器可能会与人混淆。先进的机器人技术现在是,并且在相当长一段时间内,将是信息技术最非凡的领域之一。机器人领域被认为是一个将...
阅读 8 分钟
在本教程中,我们将编写 Python 程序以递归方式删除所有相邻的重复元素。在此问题中,给出了一个字符串,我们需要返回不应包含任何相邻重复元素的输出字符串。让我们了解以下示例。示例 - 输入:bzxxa 输出:...
5 分钟阅读
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India