如何在 Python 中绘制多个线性回归17 Mar 2025 | 5 分钟阅读 建模因变量(目标变量)与单个自变量(简单回归)或多个自变量(多元回归)之间关系的策略称为线性回归。线性回归算法基于一个假设,即两种类型的变量都存在线性关系。如果存在这种关系,我们可以计算模型所需的系数,以便根据新数据或未见过的数据进行预测。 变量的描述性分析在深入应用多元线性回归之前,通常最好绘制数据的可视化图表,以便更好地理解数据,并检查每个特征之间是否存在关系。我们将使用 Seaborn 包中的 pairplot() 方法来绘制特征之间的关系图。该函数将生成一个包含每个特征的直方图和散点图的图形。 在本教程中,我们将学习如何使用 NumPy、Pandas、Scikit-Learn 和 Scipy 等各种库,从头开始在 Python 中应用和可视化线性回归过程。 导入库在第一步中,我们将导入一些所需的 Python 库,如 NumPy、Pandas、sklearn、matplotlib 等。此外,我们将使用 Pandas 库从 GitHub 存储库加载数据集,并将数据集转换为一个名为 df 的数据框。 代码 输出 (545, 4) price area bedrooms stories 0 13300000 7420 4 3 1 12250000 8960 4 4 2 12250000 9960 3 2 3 12215000 7500 4 2 4 11410000 7420 4 2 特征选择我们将使用配对图查看特征之间的关系。 代码 输出 ![]() 从图的第一行可以看出,数据集中价格和面积特征之间存在线性关系。我们可以看到,其余变量的散点图是随机的,并且它们之间没有显示出任何关系。我们应该只选择一个具有它们之间关系的多元自变量。虽然这里的价格是目标变量,因此无需删除任何特征。 多重共线性多元线性回归模型假设回归中所使用的预测变量或自变量之间不存在相关性。使用 Pandas 数据框的 corr() 方法,我们可以计算数据中任意两个特征之间的皮尔逊相关系数,并构建一个矩阵来查看任何预测变量之间是否存在相关性。之后,我们可以使用 Seaborn 的 heatmap() 图将该矩阵显示为热力图。 代码 输出 Pearson correlation coefficient matrix for each independent variable: area bedrooms stories area 1.000000 0.151858 0.083996 bedrooms 0.151858 1.000000 0.408564 stories 0.083996 0.408564 1.000000 构建多元线性回归模型让我们继续构建我们的回归模型。既然我们已经看到了特征之间没有关系和共线性,我们就可以使用所有特征来构建模型。我们将使用 Sklearn 的 linear_model 库中的 LinearRegression() 类来创建我们的模型。 代码 输出 Intercept: 157155.2578429943 Coefficients array: [4.17726303e+02 4.18703502e+05 6.73797188e+05] 我们将尝试使用下面的代码单元将我们的模型转换为三维图形。我们的数据点将以灰色圆点的形式显示在图表中,线性模型将以蓝色平面表示。 代码 输出 ![]() |
介绍:在本教程中,我们讨论如何使用 Python 中的 Asyncio 创建 telnet 客户端。Telnet 是一种使用 TCP/IP 进行连接的客户端/服务器软件协议。Telnet 协议允许用户登录并使用远程计算机,即使他们是直接连接到它的...
阅读 4 分钟
任何人都可以通过玩翻转图块游戏来测试自己的记忆力。在此集合中,每个数字或图形都有成对的图块,这是一个偶数。我们必须翻转图块,以便在它们朝下时可以看到它们。一个人翻转...
阅读 12 分钟
本教程的问题陈述是,如果我们给定一个长度为 n 的已排序数组和一个整数 x,那么我们需要找到 x 在给定数组中的较低插入索引。任何元素的较低插入索引是...
5 分钟阅读
在本教程中,我们将学习如何检查给定的数字是否为斐波那契数。在这里,我们有一个数字“n”,我们必须检查它是否为斐波那契数。斐波那契数列的起始数字是:0, 1, 1, 2, 3,...
阅读 3 分钟
在查看 re 模块的 Split、Sub、Subn 函数之前,让我们先了解一些 Python 提供的 re 模块。Regex 或正则表达式 (RE) 是一个特定的文本字符串,对于定义搜索模式非常有用...
阅读 24 分钟
Python的一个关键特性是“类型转换”。它允许程序员将变量或数据从一种数据类型转换为另一种数据类型。它可以实现数据流畅处理。在处理大量数据时,数据以……形式存在时,它会非常有用。
7 分钟阅读
天气 API 允许开发人员访问当前和历史天气数据,以便在他们的应用程序中使用。这些 API 通常以易于被 Python 等编程语言使用的数据格式提供数据。在本文中,我们将探讨如何使用 Python 来...
阅读 4 分钟
在本教程中,我们将学习 Pafy 模块。Pafy 是一个用于下载 YouTube 内容和检索元数据的 Python 模块。我们将看到如何使用 Pafy 模块执行各种操作。它提供了一种访问 YouTube 内容的简单方法...
阅读 4 分钟
Flask 是一个流行的 Web 框架,用于构建基于 Python 的 Web 应用程序。它允许开发人员通过提供用于处理路由、渲染模板、管理会话以及处理请求和响应的工具来轻松创建 Web 应用程序。Web 应用程序的一个重要方面是处理用户输入。用户可能需要...
7 分钟阅读
NumPy,简称 Numerical Python,是 Python 临床计算环境中的一个基本库。它为处理大型多维数组和矩阵提供了支持,以及一套广泛的数学功能,可以有效地对这些数组进行操作。关键功能之一...
阅读 3 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India