R 逻辑回归

2025 年 3 月 29 日 | 阅读 3 分钟

在逻辑回归中,拟合了回归曲线 y = f (x)。在回归曲线方程中,y 是一个分类变量。此回归模型用于预测 y 给定一组预测变量 x。因此,预测变量可以是分类变量、连续变量或两者的混合。

逻辑回归是一种属于非线性回归的分类算法。该模型用于根据一组自变量预测给定的二元结果(1/0,是/否,真/假)。此外,它有助于使用虚拟变量表示分类/二元结果。

逻辑回归是一种回归模型,其中响应变量具有分类值,例如真/假或 0/1。因此,我们可以衡量二元响应的概率。

以下是逻辑回归的数学方程

y=1/(1+e^-(b0+b1 x1+b2 x2+⋯))

在上述等式中,y 是响应变量,x 是预测变量,b0 和 b1、b2,...bn 是系数,即数值常数。我们使用 glm() 函数创建回归模型。

以下是 glm() 函数的语法。

此处,

序号参数描述
1.公式它是一个表示变量之间关系的符号。
2.数据它是一个给出变量值的数据集。
3.一个 R 对象,指定模型的详细信息,其值为逻辑回归的 binomial。

构建逻辑回归

内置数据集“mtcars”描述了各种汽车型号及其不同的发动机规格。在“mtcars”数据集中,变速箱模式由列“am”描述,这是一个二元值(0 或 1)。我们可以在列“am”和另外三列 - hp、wt 和 cyl 之间构建一个逻辑回归模型。

让我们看一个例子来理解如何使用 glm 函数创建逻辑回归,以及如何使用 summary 函数查找分析的摘要。

在我们的例子中,我们将使用 R 环境中可用的数据集“BreastCancer”。要使用它,我们首先需要安装“mlbench”和“caret”包。

示例

输出

R Logistic Regression

现在,我们将数据分成训练集和测试集,训练集包含 70% 的数据,测试集包含剩余的百分比。

输出

R Logistic Regression

现在,我们借助 glm() 函数构建逻辑回归函数。我们将公式 Class~Cell.shape 作为第一个参数传递,并将属性 family 指定为“binomial”,并使用 Training_data 作为第三个参数。

示例

输出

R Logistic Regression

现在,使用 summary 函数进行分析。

输出

R Logistic Regression
下一主题R 泊松回归