SPSS 多元回归

17 Mar 2025 | 4 分钟阅读

在本节中,我们将学习 多元回归多元回归是一种回归分析方法,我们观察 多个自变量一个因变量 的影响。为此,我们将采用员工数据集。此数据集根据员工的 ID、性别、教育程度、工作类别、工资、起始工资、工作时间、先前经验 以及他们是否属于 少数族裔 社区进行排列。

Multiple Regressions of SPSS

现在假设在这个数据集中,我们想找出到底是什么决定了 员工 获得的 当前工资

Multiple Regressions of SPSS

当前工资 可以由他们 入职 时的 工资 决定,因为可以合理地假设,那些在 入职 时获得 较高工资 的员工,目前也会获得 较高工资。我们还可以猜测员工的 经验 也会影响他们获得的 工资。除此之外,我们还有 教育程度。因此,教育程度再次成为决定 工资 的一个重要标准。那些受过高等教育的员工可以推测,与那些 受教育程度较低 的员工相比,他们获得的 工资 较高。

Multiple Regressions of SPSS

同样,我们也可以猜测 工资 也会受到员工职位的影响。在我们的例子中,我们有 三个 员工类别,即 文员、保管员、经理

Multiple Regressions of SPSS

我们可以猜测 经理文员保管员 获得的 工资 更高。假设我们想测试这些假设,即员工的 工作类别、教育程度职位入职 时的 工资 是否是影响员工 当前工资 的因素。在这种情况下,我们必须运行 多元回归分析。多元回归分析的思路非常明确。当我们要预测 一个因变量(在我们的例子中是 当前工资)时,可以使用 多个自变量,例如 教育程度、工作类别、起始工资、工作时间、先前经验,然后我们可以执行 多元回归 分析。

当我们执行 多元回归 分析时,我们的变量必须经过逻辑选择。 例如,我们是否相信 少数族裔 身份会 影响 一个人的 工资。嗯,这可能会也可能不会。所以说起来很有趣,但从理论上讲,如果我们找到任何理由证明一个人的 少数族裔 身份可能会 影响 他或她的 工资,那么我们也可以在 多元回归 分析中包含该变量,或者如果我们要包含 所有 变量 在我们的 多元回归 分析中,我们可以这样做。SPSS 会告诉我们该变量是否对 因变量 产生 显著影响

Multiple Regressions of SPSS

多元回归模型 非常简单。我们必须选择一个 因变量。通常,我们用符号 y 表示我们的 因变量,然后我们有很多 自变量,我们可以将它们称为 x1、x2、x3 直到 xn

(y = x1 x2 x3 + ----- + xn

现在我们将通过应用 多元回归 分析来获得 系数。假设这些常数或系数为 α1x1 + α2x2 + α3x3 直到 αnxn。现在我们将进行 预测。现在我们基于这些 x 变量x1xn 来预测 y。我们会犯一些错误,因为我们不能总是找到所有那些能够完全预测 y 的变量。因此,这些必然会存在一些 误差项。同样,我们将把它找出来。除此之外,我们的 回归方程 中还将有一个 常数

y = α1x1 + α2x2 + α3x3 + ----- + αnxn + error + constant 

这就是我们典型的 理论回归模型。现在我们必须使用 α 这个词,但通常人们使用 β 这个词,所以我们可以再次将方程重写为 β1x1 + β2x2 + β3x3 直到我们有 βnxn 然后是我们的误差项加上 常数 项。

y = β1x1 + β2x2 + β3x3 + ----- + βnxn + error + constant 

这个 β 是我们在回归分析之后将要获得的 标准化回归权重。在我们的例子中,我们想要 预测 员工当前工资。所以,我们将把我们的 多元回归方程 写成 当前工资 = β1。现在将一个变量作为员工的起始工资,所以 当前工资 = β1* 起始工资

Current Salary = β1* Beginning salary

现在我们可以将我们的 第二个 变量作为 教育程度。为此,我们将获得第二个系数,即 β2* 教育程度类别

Current Salary = β1* Beginning salary + β2* education category

然后我们将第三个变量作为经验。所以,为此,我们将获得第三个系数,即β3*经验。因此,我们通过考虑三个变量构建了一个样本模型。

Current Salary = β1* Beginning salary + β2* education category + β3* experience 

如果我们想采用 更多变量,我们可以这样做。我们可以创建一个 冗长 或复杂的 回归模型。现在我们将添加我们的 误差 项,然后添加 常数。这使我们的回归模型更加清晰。

Current Salary = β1* Beginning salary + β2* education category + β3* experience + error + constant

我们可以看到,在 多元回归 分析中,我们可以将 自变量 作为 名义 变量或 度量 变量。 自变量 可以是 度量非度量。但是在 多元回归 分析或 线性 回归分析或 分层 回归分析的情况下,我们的 因变量 应该始终是 度量

Current Salary = β1* Beginning salary + β2* education category + β3* experience + error + constant