R - 多元线性回归

17 Mar 2025 | 阅读 2 分钟

多元线性回归是简单线性回归的扩展,用于根据多个不同的预测变量 (x) 预测结果变量 (y)。借助三个预测变量 (x1, x2, x3),y 的预测使用以下公式表示

y=b0+b1*x1+b2*x2+b3*x3

“b” 值代表回归权重。它们衡量结果变量与预测变量之间的关联。”

多元线性回归是在两个以上变量之间关系的线性回归的扩展。在简单线性回归中,我们有一个预测变量和一个响应变量。但在多元回归中,我们有多个预测变量和一个响应变量。

多元回归的一般数学公式如下:

y=b0+b1*x1+b2*x2+b3*x3+⋯bn*xn

此处,

  • y 是一个响应变量。
  • b0, b1, b2...bn 是系数。
  • x1, x2, ...xn 是预测变量。

在 R 中,我们借助 lm() 函数创建回归模型。该模型将借助输入数据确定系数的值。我们可以使用这些系数来预测响应变量对于一组预测变量的值。

以下是多元回归中 lm() 函数的语法

在进一步操作之前,我们首先为多元回归创建数据。我们将使用 R 环境中存在的“mtcars”数据集。该模型的主要任务是创建“mpg”作为响应变量与“wt”、“disp”和“hp”作为预测变量之间的关系。

为此,我们将从“mtcars”数据集中创建这些变量的子集。

输出

R Multiple Linear Regression

创建关系模型并找到系数

现在,我们将使用之前创建的数据来创建关系模型。我们将使用 lm() 函数,该函数有两个参数,即公式和数据。让我们开始了解如何使用 lm() 函数创建关系模型。

示例

输出

从上面的输出中可以清楚地看出,我们的模型已成功设置。现在,我们的下一步是借助模型找到系数。

b0<- coef(Model)[1]
print(b0)
x_wt<- coef(Model)[2]
x_disp<- coef(Model)[3]
x_hp<- coef(Model)[4]
print(x_wt)
print(x_disp)
print(x_hp)

输出

R Multiple Linear Regression

回归模型的公式

现在,我们有了系数和截距值。让我们开始创建一个我们将用于预测新值的数学公式。首先,我们将创建一个公式,然后使用该公式来预测在提供了新的一组权重、位移和马力值时,里程数是多少。

让我们看一个例子,其中我们预测一辆重量为 2.51、位移为 211 和马力为 82 的汽车的里程数。

示例

输出

R Multiple Linear Regression
下一个主题R 逻辑回归